有做计算机视觉，图像识别的同胞吗?

yangdi12 · 发表于 2016-4-26 22:46

only555 发表于 2016-4-26 20:55
我大概看明白你的意思了，原来这么麻烦的东西。我们机器学习这块像选特征值，实现算法，选最 ...

类似的事情我做过MATLAB版本，快把我招去你们公司吧！开玩笑：）
不过根据我自己实现的经验，如果你是固定位置的摄像头(比如监控)，需要加一个前景检测。如果不是，需要一个slide window，把人体部分给扫出来。
另外2D图像如果你要实时识别动作内容，很难，因为你在实际应用的时候会有很多*中间动作*。即使是标准动作，准确率也比kinect的punktwolken作为输入低上至少10几个百分点。
你的需求我大概看明白了：没你想象地那么容易。配一个两个人的组，三个月，差不多能做出个凑合能用的Demo。

yangdi12 · 发表于 2016-4-26 22:48

sailajohn 发表于 2016-4-26 21:19
如果你拥有大量训练数据，每个类别超过至少1000幅以上的图片，并且分布相对平均，我建议你使用深的卷积神经 ...

思路是对的，但是以他800*600的尺寸不做压缩的话，基本上没什么服务器能承担得了训练的任务……即使压缩到40*30，假设20000的训练集，GTX980上跑CUDA，我估计训练一次少说也要将近一晚。调参之路无尽头……

yangdi12 · 发表于 2016-4-26 23:06

bitsun 发表于 2016-4-26 23:00
随着你的表述越来越多，感觉你是要做一个human action recognition?
那第一步应该是做 human detection, ...

我觉得楼主已经越陷越深了，想得太简单了。
对于他的需求我能想到的CV细分领域已经有以下几个了:
- 抗干扰/光照变化的自更新前景检测
或 -窗口式人体检测
- 静态动作识别（常规feature提取+训练, 包括但不限于hog,surf,sift，如果用DL就是CNN）
或 -动态动作识别（时间/因果相关feature和分类器，例如MHI, HMM, 如果用DL就是RNN)

传统方法免不了各种feature/ Classifer的结果对比和算法的调参， DL方法免不了CUDA+显卡的配置和硬件的瓶颈。开源的framework就那么几个，caffee自由度非常小，theano需要自己搭架子。而且各个framework如果是第一次配置，非常非常折腾。

sailajohn · 发表于 2016-4-26 23:26

yangdi12 发表于 2016-4-26 23:48
思路是对的，但是以他800*600的尺寸不做压缩的话，基本上没什么服务器能承担得了训练的任务……即使压缩 ...

显然兄弟你并没有太多深度学习相关的实验背景，别介意啊，首先，输入图片压缩是对的，但是你对现在硬件对深度学习的支持还是太没信心了，我们的实验基本上都是百万副图片以上的训练集，用GTX980级别的显卡也是可以承受的，前两年刚开始做的时候780也用过的，当然训练个几天是正常的，但这没有关系，一旦模型训练好了，做分类和识别时就很快了。举个例子，入门级的手写体数据集MNIST，大概5万副图片而已，在一个GTX780上训练一个3层卷机加3层全连的深度模型（分类准确率已可达98%以上）用caffe只需20分钟而已。

usstlf · 发表于 2016-4-26 23:30

感觉问题还是应该出在feature extration上吧，fe用的方法可能过于简单了。前段时间用了个svda的算法，图像识别时用来去特征值特别好用(▽)

sailajohn · 发表于 2016-4-27 07:21

黯然浪子发表于 2016-4-27 00:59
一群傻逼。你妈图像识别还你妈讨论，早他妈都有现成算法了。楼主就是一个图像识别菜鸟，你妈机器学习你丫都 ...

你看别人都不顺眼，你觉得自己又是个什么玩意儿？别人菜鸟又怎么啦？管你什么事？你就是他妈一心里阴暗的小人，就是因为这个世界上有你这种人存在才变的恶心。

only555 · 发表于 2016-4-27 11:08

sailajohn 发表于 2016-4-27 08:21
你看别人都不顺眼，你觉得自己又是个什么玩意儿？别人菜鸟又怎么啦？管你什么事？你就是他妈一心里阴暗的 ...

那个人怎么回事啊，上来就疯咬，一咬一群，要是谁说什么了，你不同意就一起讨论吗，骂人干嘛啊。这是浪子吗? 这是疯子吧。。。

only555 · 发表于 2016-4-27 11:16

yangdi12 发表于 2016-4-27 00:06
我觉得楼主已经越陷越深了，想得太简单了。
对于他的需求我能想到的CV细分领域已经有以下几个了:
- 抗 ...

今天上午和同事聊了一下，刚吃饭的时候还说这事呢，如果aufwand 真这么多，我们就没法自己做了，打算下午去头那边问问今年buget 还多少。要是还够的话，可能就要找extern 来做。非常感谢大家的回复。估计要是buget不够的话，不能找extern 还得我们自己来。晕倒。呵呵，到时候还得请大家指教

yangdi12 · 发表于 2016-4-27 17:02

sailajohn 发表于 2016-4-27 00:26
显然兄弟你并没有太多深度学习相关的实验背景，别介意啊，首先，输入图片压缩是对的，但是你对现在硬件对 ...

哈哈，不介意不介意，我做SVM多一点，深度学习只是用来做过论文里的和svm结果的对比。作为个打酱油的只用过caffe和theano，还是同事帮忙一起配置的。当时做的是80*60的RGB图像，4个分类大概加一块15000个图片。但当时印象里训练起来非常慢，以数小时记。大概是两年前的事情，具体显卡型号也记不清了。看来现在我真的out了。已经很久不做算法了，但还是很关注这个方向的动态，以后多多向你讨教哈

sailajohn · 发表于 2016-4-28 01:36

only555 发表于 2016-4-27 12:16
今天上午和同事聊了一下，刚吃饭的时候还说这事呢，如果aufwand 真这么多，我们就没法自己做了，打算下 ...

楼主你那边如果有需求，有项目外包的可能，也许我们有项目合作的可能性？如果你是在sap的部门，那么就比较方便了。

sailajohn · 发表于 2016-4-28 06:39

yangdi12 发表于 2016-4-27 18:02
哈哈，不介意不介意，我做SVM多一点，深度学习只是用来做过论文里的和svm结果的对比。作为个打酱油的只用 ...

不敢不敢，我们是相互交流学习。

only555 · 发表于 2016-4-28 20:25

sailajohn 发表于 2016-4-28 02:36
楼主你那边如果有需求，有项目外包的可能，也许我们有项目合作的可能性？如果你是在sap的部门，那么就比 ...

你们是属于哪一类的啊? 想Hays那种DL，还是一个consulting公司，还是Freelancer 啊? 方便站短留个联系方式吗?如果我们最后要找extern的话我好联系你。但我们公司一般有几个consulting 公司经常给我们做项目，我也不知道最后会不会还是让他们做，但他们以前做的一般都是sap 的东西，这个我还真担心他们不行。

leelight · 发表于 2016-4-29 13:12

only555 发表于 2016-4-26 20:55
我大概看明白你的意思了，原来这么麻烦的东西。我们机器学习这块像选特征值，实现算法，选最 ...

这个监控能做出来很牛了，有前途

zbbcm_11 · 发表于 2016-4-29 13:55

leelight 发表于 2016-4-29 14:12
这个监控能做出来很牛了，有前途

怕怕，上班不敢干别的了，我下线先

糖醋里脊 · 发表于 2016-4-29 15:14

我做的是比较简单的字符识别，具体就是识别医生Rezept上的数和字。
做法很简单
我先扫描一些Rezepte，统计一下颜色的分布，处理掉颜色，然后找到字体轮廓，最后把转成黑白的图像送去学习。效率还不错，很满意。

leelight · 发表于 2016-4-29 15:18

糖醋里脊发表于 2016-4-29 16:14
我做的是比较简单的字符识别，具体就是识别医生Rezept上的数和字。
做法很简单
我先扫描一些Rezepte，统 ...

我觉得字符处理是图像处理的入门，不过可以往深里研究，算法大同小异

账号		自动登录	找回密码
密码			注册

萍聚头条

[职业生涯] 有做计算机视觉，图像识别的同胞吗?

点评

点评

点评

点评

本帖子中包含更多资源

浏览过的版块