https://www.pmcaff.com/discuss/index/480966354177088?from=related&pmc_param%5Bentry_id%5D=1000000000167873
自问自答一发。之前写过2篇相关的文章:
【数据运营】在运营中,为什么文本分析远比数值型分析重要?(上)
【数据运营】在运营中,为什么文本分析远比数值型分析重要?一个实际案例,五点分析(下)
除了上面那几种应用,这种基于大数据的文本分析还有如下实际应用:
1 传播分析
检索对象在传播趋势和传播渠道上的分析。
- 传播走势
- 传播渠道
2 情感分析
情感分析指的是对文本中情感的倾向性和评价对象进行提取的过程。
基于上百万条社交网络平衡语料和数十万条新闻平衡语料的机器学习模型,结合自主开发的半监督学习技术,正负面情感分析准确度达到80%以上,可以轻松的识别网民对于某一检索对象的好恶倾向,最直接的应用就是品牌口碑检测领域。
3 信息分类
文本信息分类将文本按照预设的分类体系进行自动区分。常见的商业应用前景有:
通过社交网络挖掘商业情报和潜在销售机会;
- 企业内文本数据分析;
- 海量数据筛选;
- 资讯分类;
- 自动标签预测等。
4 典型意见提取
- 微博评论典型意见
- 网民典型评论
典型意见引擎将消费者意见进行单句级别的语义聚合,提取出有代表性的意见。常见的商业应用前景有:
- 消费者调研;
- 电商点评分析;
- 社会热点事件的意见整理。
5 文本聚类
相似文本聚类指的是机器自动对给定的文本进行话题聚类,将语义上相似的内容归为一类。常见的商业应用前景有:
- 海量文档、资讯的整理;
- 话题级别的统计分析。
6 关键词抽取
- 文章关键词抽取
- 用户评论关键词抽取
关键词提取引擎从一篇或多篇文本中提取出有代表性的关键词。关键词提取技术综合考虑词语在文本中的频率,和词语在千万级背景数据中的频率,选择出最具有代表性的关键词并给出相应权重。
可以使用户在如恒河沙数的文本数据中提炼出有价值的信息,节省阅读时间。
7 语义网络分析、知识图谱
通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法引入文本数据分析领域,并结合共现分析手段,可视化语义网络呈现各类文本/信息之间的内在相关关系,时间维度上的动态关系(传播路径)。
- 知识图谱网络
- 传播网络
- 商品关联网络
1.锤子新发布的功能“BigBang”分词功能。也算是大数据文本分析的应用,通过大数据文本分析,才能实现对词义的准确分析,从而做到更准确的分词。
2.网络舆情监控。这也当然是大数据文本分析的产物,提取网络文本的关键词,组成语义网络之后分析语义倾向,达到舆情监控的目的。
3.社交网络情绪监控。相信大家都看到了很多网络上直播自杀、发自杀预报的这样的事情,和舆情监控相同,就是对个人社交网络的信息进行监控,通过文本分析和机器学习的技术,分析出此人的情绪状况,一旦出现极端的负面情绪,可以通过一定的措施避免极端行为的发生。
4.证券行业投资情报获取。可以基于积累的大数据做进一步深层次的分析与挖掘,整合各社交网络、证券讨论社区群体信息提取加工成有价值的证券投资情报,对证券投资行为做辅助分析和预报。