萍聚社区-德国热线-德国实用信息网

 找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 1092|回复: 13

[其它] 请问各位大牛,德语文本挖掘有什么傻瓜工具可以用啊?

[复制链接]
发表于 2016-8-2 04:58 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x
老板想找人分析email,看这几年客户的email出现了哪些关键词。。。
但是老板不懂什么技术,打算叫人一个一个把email读了,然后分类虽然任务还没有分配下来,但是可以肯定是我来做这事。。。
6年的email。这个数量不是开玩笑啊。。。
后来想到貌似有文本挖掘的工具,可惜我不是学这个的,查了下中文资料,发现中文有傻瓜工具,输进去就行了。。。
不知道有没有支持德语的傻瓜文本挖掘工具?
我唯一需要的功能,就是文字出现频率。。。
还是,文本挖掘,必须要先学习Python ?
求大牛们给我指一条明路,不求解决问题,只求一个方向。。。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
发表于 2016-8-2 18:00 | 显示全部楼层
本帖最后由 博士祭酒 于 2016-8-2 19:15 编辑

根据你的描述,你老板让你做的,
应该是最基础的 qualitative coding,
而并非你和其他几位所认为的 quantitative,
你具体要做的,叫作 grounded codes,
是文本分析和话语分析的一种,
属于社会科学的范畴(因为你是要分析人类的语言,而不是分析计算机代码),
所以一般用 NVivo!

点评

非常感谢,我现在去查查NVivo这方面的资料  发表于 2016-8-2 19:08
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
发表于 2016-8-2 06:40 | 显示全部楼层
本帖最后由 Sky23 于 2016-8-2 06:41 编辑

单击开链:
Data mining with R : learning with case studies



点评

非常感谢!!!  发表于 2016-8-2 09:36
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
发表于 2016-8-2 08:37 | 显示全部楼层
本帖最后由 harryzs 于 2016-8-2 09:40 编辑

着急的话,花点钱找个人就分析了。

不着急的话,Python是你的首选。 R在Data science领域肯定很强大,不过单是文本挖掘还是python稍微强一点,而且python比较容易上手。

最佳组合应该是Python提取信息, R 做machine leraning,特别是后续如果你需要建立预测模型,R 简直太强大了。

https://datawarrior.wordpress.co ... hon-on-text-mining/


PS: R python julia 号称Data science 新三剑客。。。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
 楼主| 发表于 2016-8-2 09:43 | 显示全部楼层
harryzs 发表于 2016-8-2 09:37
着急的话,花点钱找个人就分析了。

不着急的话,Python是你的首选。 R在Data science领域肯定很强大,不 ...

非常非常感谢!现在去找python的资料
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
发表于 2016-8-2 17:22 | 显示全部楼层
本帖最后由 Sky23 于 2016-8-2 21:28 编辑
lulu家的主人 发表于 2016-8-2 09:43
非常非常感谢!现在去找python的资料

书:
1. lerning python
2. Introducing Data Science: Big Data, Machine Learning, and more, using Python tools
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
发表于 2016-8-2 17:38 | 显示全部楼层
免费数据挖掘软件:
单击开链:
weka
orange

点评

谢谢你一连给了我好几个链接,真的很感谢  发表于 2016-8-2 19:08
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
发表于 2016-8-2 19:19 | 显示全部楼层
  有很多词频统计软件,有免费的,收费的,淘宝上国人自己开发的也就几十元。只是德语,英语的词语有变形,要考虑一下。

点评

词频:Wortfrequenz,Worthäufigkeit。  发表于 2016-8-2 21:27
问一个脑残的问题。。。词频的德语该是什么啊?我怕我Google翻译出来不准。。。。  发表于 2016-8-2 20:38
谢谢你,刚刚在淘宝上查了下,果然超级多,谢谢  发表于 2016-8-2 20:36
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

手机版|Archiver|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-1-10 15:05 , Processed in 0.068026 second(s), 19 queries , MemCached On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表