yangdi12
发表于 2016-4-26 23:46
only555 发表于 2016-4-26 20:55
我大概看明白你的意思了,原来这么麻烦的东西。 我们机器学习这块像选特征值,实现算法,选最 ...
类似的事情我做过MATLAB版本,快把我招去你们公司吧!开玩笑:)
不过根据我自己实现的经验,如果你是固定位置的摄像头(比如监控),需要加一个前景检测。如果不是,需要一个slide window,把人体部分给扫出来。
另外2D图像如果你要实时识别动作内容,很难,因为你在实际应用的时候会有很多*中间动作*。即使是标准动作,准确率也比kinect的punktwolken作为输入低上至少10几个百分点。
你的需求我大概看明白了:没你想象地那么容易。配一个两个人的组,三个月,差不多能做出个凑合能用的Demo。
yangdi12
发表于 2016-4-26 23:48
sailajohn 发表于 2016-4-26 21:19
如果你拥有大量训练数据,每个类别超过至少1000幅以上的图片,并且分布相对平均,我建议你使用深的卷积神经 ...
思路是对的,但是以他800*600的尺寸不做压缩的话,基本上没什么服务器能承担得了训练的任务……即使压缩到40*30,假设20000的训练集,GTX980上跑CUDA,我估计训练一次少说也要将近一晚。调参之路无尽头……
yangdi12
发表于 2016-4-27 00:06
bitsun 发表于 2016-4-26 23:00
随着你的表述越来越多,感觉你是要做一个human action recognition?
那第一步应该是做 human detection, ...
我觉得楼主已经越陷越深了,想得太简单了。
对于他的需求我能想到的CV细分领域已经有以下几个了:
- 抗干扰/光照变化的自更新前景检测
或 -窗口式人体检测
- 静态动作识别 (常规feature提取+训练, 包括但不限于hog,surf,sift,如果用DL就是CNN)
或 -动态动作识别(时间/因果相关feature和分类器,例如MHI, HMM, 如果用DL就是RNN)
传统方法免不了各种feature/ Classifer的结果对比和算法的调参, DL方法免不了CUDA+显卡的配置和硬件的瓶颈。开源的framework就那么几个,caffee自由度非常小,theano需要自己搭架子。而且各个framework如果是第一次配置,非常非常折腾。
sailajohn
发表于 2016-4-27 00:26
yangdi12 发表于 2016-4-26 23:48
思路是对的,但是以他800*600的尺寸不做压缩的话,基本上没什么服务器能承担得了训练的任务……即使压缩 ...
显然兄弟你并没有太多深度学习相关的实验背景,别介意啊,首先,输入图片压缩是对的,但是你对现在硬件对深度学习的支持还是太没信心了,我们的实验基本上都是百万副图片以上的训练集,用GTX980级别的显卡也是可以承受的,前两年刚开始做的时候780也用过的,当然训练个几天是正常的,但这没有关系,一旦模型训练好了,做分类和识别时就很快了。举个例子,入门级的手写体数据集MNIST,大概5万副图片而已,在一个GTX780上训练一个3层卷机加3层全连的深度模型(分类准确率已可达98%以上)用caffe只需20分钟而已。
usstlf
发表于 2016-4-27 00:30
感觉问题还是应该出在feature extration上吧,fe用的方法可能过于简单了。前段时间用了个svda的算法,图像识别时用来去特征值特别好用(▽)
sailajohn
发表于 2016-4-27 08:21
黯然浪子 发表于 2016-4-27 00:59
一群傻逼。你妈图像识别还你妈讨论,早他妈都有现成算法了。楼主就是一个图像识别菜鸟,你妈机器学习你丫都 ...
你看别人都不顺眼,你觉得自己又是个什么玩意儿?别人菜鸟又怎么啦?管你什么事?你就是他妈一心里阴暗的小人,就是因为这个世界上有你这种人存在才变的恶心。
only555
发表于 2016-4-27 12:08
sailajohn 发表于 2016-4-27 08:21
你看别人都不顺眼,你觉得自己又是个什么玩意儿?别人菜鸟又怎么啦?管你什么事?你就是他妈一心里阴暗的 ...
那个人怎么回事啊,上来就疯咬,一咬一群,要是谁说什么了,你不同意就一起讨论吗,骂人干嘛啊。这是浪子吗? 这是疯子吧。。。
only555
发表于 2016-4-27 12:16
yangdi12 发表于 2016-4-27 00:06
我觉得楼主已经越陷越深了,想得太简单了。
对于他的需求我能想到的CV细分领域已经有以下几个了:
- 抗 ...
今天上午和同事聊了一下,刚吃饭的时候还说这事呢,如果aufwand 真这么多, 我们就没法自己做了,打算下午去头那边问问今年buget 还多少。要是还够的话,可能就要找extern 来做。非常感谢大家的回复。估计要是buget不够的话,不能找extern 还得我们自己来。晕倒。呵呵, 到时候还得请大家指教
yangdi12
发表于 2016-4-27 18:02
sailajohn 发表于 2016-4-27 00:26
显然兄弟你并没有太多深度学习相关的实验背景,别介意啊,首先,输入图片压缩是对的,但是你对现在硬件对 ...
哈哈,不介意不介意,我做SVM多一点,深度学习只是用来做过论文里的和svm结果的对比。作为个打酱油的只用过caffe和theano,还是同事帮忙一起配置的。当时做的是80*60的RGB图像,4个分类大概加一块15000个图片。但当时印象里训练起来非常慢,以数小时记。大概是两年前的事情,具体显卡型号也记不清了。看来现在我真的out了。已经很久不做算法了,但还是很关注这个方向的动态,以后多多向你讨教哈{:8_475:}
sailajohn
发表于 2016-4-28 02:36
only555 发表于 2016-4-27 12:16
今天上午和同事聊了一下,刚吃饭的时候还说这事呢,如果aufwand 真这么多, 我们就没法自己做了,打算下 ...
楼主你那边如果有需求,有项目外包的可能,也许我们有项目合作的可能性?如果你是在sap的部门,那么就比较方便了。