萍聚社区-德国热线-德国实用信息网

 找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 4069|回复: 51

[职业生涯] 有做计算机视觉,图像识别的同胞吗?

[复制链接]
发表于 2016-4-25 22:09 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x
本人工作的一部分是机器学习,除了工作的原因自身对这个方向 也很感兴趣。 最近做个图像识别的机器学习算法, 但是出现一个问题就是当图片上是同一个人的时候,人的各个身体部位识别的还挺好的,识别率甚至可以达到97%,但是换了另外一个人就基本什么都识别不出来了。 因为我个人是计算机专业出身的,所以对图像的pixel 的认识很浅薄,可以说是一窍不懂吧。我自己的猜测是因为我把图像数据化的时候pixel转换不对,导致算法学习的很单一,基本就是1对1的去学了,没有找到共同性。 因为之前问SAP的问题,遇到好心同胞的帮忙所以这次还想问问有有没有人做计算机视觉或者图像识别之类的。像我上面出的情况有可能是哪里出错了呢——还有大家把图片数据化的时候,如果把一个图片的pixel矩阵 例如640*480转换成一行的话,比如1*10,1*100之类的,有没有什么转换方法能够在信息流失度最小的情况下把一个图片变成一行数据?我基本用的就是R或者python.
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
发表于 2016-4-26 09:18 | 显示全部楼层
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
发表于 2016-4-26 10:08 | 显示全部楼层
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
发表于 2016-4-26 10:14 | 显示全部楼层
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
发表于 2016-4-26 10:21 | 显示全部楼层
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
发表于 2016-4-26 10:28 | 显示全部楼层
楼主你问的问题很不清楚
1.你用了什么学习方法,bayes classifier? SVM? random forest? neural network? 假如是用流行的SVM, 你用了什么kernel,什么参数,具体到implementation,你用了什么库?
2。 你的识别器的学习数据是哪里来的,是自己annotate,还是来自公开数据。从你描述来看,似乎有点over fitting的问题
3. 楼主似乎要用识别人的身体部位,我的经验是这个微软的kinetic sdk已经做的非常好了

你的问题,“640*480转换成一行的话,比如1*10,1*100之类”
建议使用haar wavelet transformation,具体怎么做可以google
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
发表于 2016-4-26 10:32 | 显示全部楼层
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
 楼主| 发表于 2016-4-26 11:32 | 显示全部楼层
bitsun 发表于 2016-4-26 10:28
楼主你问的问题很不清楚
1.你用了什么学习方法,bayes classifier? SVM? random forest? neural network?  ...

我自己猜测也是 over Fitting 了。 现在用的算法是xgboost但最后用什么算法,还不确定,我们没有固定的算法限制,都是看最后哪个结果好。然后用哪个。 主要的问题还是图片转换成正常数据的问题,只要这个转换好了,我们其他的学习方法就都能拿来用和比较了。 关于矩阵的问题我举个例子。我们现在把图片import 到R里面,保存的结果就是每个图片一个 480 行 640 列的一个像素矩阵。 但正常机器学习是一行对应一个分类,于是我们就想方法把每个图片的这个像素矩阵转换成一行,然后才能在这个数据上面用分类算法。 我出现over Fitting 的问题,我的猜测就是我们转换矩阵成一行数据的时候,转换的方法不对,我们把图像的颜色都换成灰色等等一系列预处理,然后在这个预处理好的图片基础上转换成一行数据。就是怕算法例如根据人的衣服颜色啊,什么之类的1:1 的去学了。我们现在没有图像处理方面的同事,大家都是计算机或者数学出身,我就是想问问 Image processing 这块怎么预处理,才能把一张图片的像素矩阵转换成一张图片一行数据,而且还能保留图像包含的内容。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
发表于 2016-4-26 13:01 | 显示全部楼层
only555 发表于 2016-4-26 11:32
我自己猜测也是 over Fitting 了。 现在用的算法是xgboost但最后用什么算法,还不确定,我们没有固定的算 ...

对不对你把图像换成BMP看看就知道了。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
 楼主| 发表于 2016-4-26 13:10 | 显示全部楼层
mib 发表于 2016-4-26 13:01
对不对你把图像换成BMP看看就知道了。

数字化以后如果还是矩阵格式,换成BMP图像肯定是一样的,但是问题是换成一行数据以后,这个不可能再转成图片啊,但是要做机器学习,我们还必须把它转成一行数据,要不算法没法用
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

手机版|Archiver|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2024-11-2 18:19 , Processed in 0.089636 second(s), 14 queries , MemCached On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表