而分类问题体现在数学上,其实就是对坐标系的分割。
每一张包含了手写数字的图像,通过提取特征后,都可以在坐标系找到属于它的位置。而SVM要干的事情,就是仔细划分这些不同位置的坐标点。
属于“0”的坐标点要和“1”的坐标点清清楚楚地分开。其余数字依次同理。
这个坐标系很复杂,有N个维度。假如一张图片的像素点是100*100的,将它整个扔给计算机的话,那就有1万个输入维度。人类所能理解的图形极限是三维,所以1万维是完全不可能画得出来的。
画不出来还是小事,可以自行脑补嘛。计算和特征提取才是大事。
维度越大,所需的计算量也就越大,算得也就越慢。如果一个程序识别一个手写数字要花10秒,那一定会被骂成“人工智障”,这就是“人工智障三人组”最初名号的由来。齐凡是从计算机学院其他学长口中得知的。当然,现在已经不这样了。
所以,进行计算前,势必要将图像参数简化一下。
同时,图像还涉及到清晰度和对比度的问题。
因而,齐凡被图像的“池化”“锐化”等概念虐了一通后,总算将它们掌握了。
最后就到了最关键的一步--图像最真实的特征。
图像的特征自然是来自于像素点。可其实不仅仅体现在像素点的灰度值上,还体现在像素点的排列上。
如果直接将像素点的坐标和值作为输入参数,那就会带来一个问题。
假如一个一模一样的数字“1”,出现在一张纸的不同位置。这对以上方法来说,就是不同的输入参数,因为其坐标位置变化了。可按实际情况,这个数字并没有任何改变,只是位置发生了变化而已。
位置的变化不应该带来输入参数的变化,因为人类识别数字也并不需要参数数字整体的位置。
齐凡带着疑问在书上找到了答案--变化特征。
通过提取相邻像素点灰度值的变化作为特征,这样就能摒弃数字坐标位置不同而引入的干扰。
这就是方向梯度直方图(Histogram of Oriented Gradient)的核心概念。
【计算机经验+10。】
到此为此,图像特征提取部分已被齐凡搞定。
剩下的,就是找寻许阳他们所用的模型到底是哪里出了问题,以至于会出现40%多识别错误率。
-----------------
心情愉悦的齐凡,收起东西从图书馆回到宿舍。
齐凡一进宿舍,王哲就火急火燎地开口,“怎么发你微信过了半天才回,今天微积分课吴院长点名,你又不是在。他现在每回都会特意关注你,你要是再不去,他可真就要发飙了。”
齐凡最近的行为在同学们看来简直就是作死,连最近看不惯他的贾震都开始对他同情了。
“齐凡,十年寒窗不容易,伱这么个作法,早晚要被开除学籍的。何必呢。”只要不挑战贾震的学霸权威,他也不是什么十足的坏人。
“多谢你们关心。可我早就和你们说过了呀。是因为王教授叫我去帮忙。”
从对面两人的神情来看,显然不信。齐凡也只有无奈。
“算了,等后天吧。后天的微积分课正好有些内容我还需要巩固下,到时你们看,吴院长会不会管我。”齐凡自信王教授肯定已经都打好招呼了。
>>章节报错<<