【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

2016 年,文本分析、情感分析和社交分析的 10 大趋势

  • 2016-02-03
  • 本文字数:2732 字

    阅读完需:约 9 分钟

文本分析、情感分析和社交分析帮助你在一定规模上转化成客户、病人、公众以及市场的“声音”。这项技术目前大量地应用于一系列的工业产品中,从医疗健康到金融、媒体、甚至客户市场。它们从线上、社交网络、企业数据源中提取商业洞察力。

它从文本中、音频中、图像中还有网络连接中提取洞察力,它可真是个有用的东西!

目前分析技术发展得还是相当不错的,尽管在某些领域,例如数字分析和市场研究有些稍稍落后。但是甚至是在例如“客户体验、社群聆听、用户交互”方面,还是有很多发展空间。这个快速发展的市场空间无论对于新加入的玩家还是深耕已久的资深人士都意味着大量的机遇。

随着技术和应用不断融合,与其独立地检验每个分析领域,还不如好好地观察整体的效果。忽视情感的社交分析是不完整的,并且为了从网络上获取社交情感数据并调查情感数据,我们真的需要文本分析技术。

本文对即将到来的 2016 年,针对文本分析、情感分析和社交分析的发展趋势进行一个前瞻性的观察。

一、多语言才是王道

尽管单纯英文的文本分析一直保持常态,但仅将一种语言做好,也比囊括很多种语言,却哪种都做得潦草要强得多。机器学习和机器翻译已经向着多语种文本分析迈进了一大步,使其成为一个全新的标准。但是如果你的确需要做多语种的开发尝试,事先也要做一些调查:很多开发者在其核心语言上很强,但在别的语言上就很弱了。所以说选择的时候还是小心一点。

二、文本分析获得认可

文本分析能力对于客户体验、市场研究、客户洞察、数字分析乃至媒体评测来说都是关键解决方案,各个文本分析服务提供商在分析能力的优势上不断竞争。总的趋势是“量化定性”,文本分析被纳入业务解决方案中是十分重要的事。

三、机器学习、统计学和语言工程并存

明天是属于机器学习、递归神经网络以及相似技术的,但是今天,长期建立的语言工程方法仍占上风。这里我指的是分类系统、分析器、词法和句法网络以及句法规则系统。目前我们处在一个“百花齐放、百家争鸣”的时代,所以很多种方法都是可以并存的。举例来说,甚至众包数据处理的领军企业:CrowdFlower 都全面拥抱机器学习了,初创企业 Idibon 都把传统和现代相结合作为一大卖点:“你可以组建自定义的分类系统,并使用机器学习、规则和你已有的字典 / 模式去调整它们。”

四、图像分析进入主流

全球领先的图像分析提供商已将图像分析技术应用于社交媒体的品牌信号解读中—不信你看看 Pulsar 和 Crimson Hexagon—并且通过机器学习,图像分析技术已成为 IBM 在 2015 年收购 Alchemy API 的一大卖点。的确,火热的初创企业 MetaMind 在 2015 年从 NLP 领域转型到图像分析,缘于其意识到图像分析背后的巨大机遇。

五、语音分析取得突破,视频分析随之而来

整个市场喜欢谈论多渠道分析和用户旅程,这涉及到多重触点。并且社交网络和网络媒体中充斥着视频,说出来的话,还有非文本形式的语言要素,包括语调、语速、音量和重复,都传递着含义,而这些含义都可以通过语音分析和语音转文字来获取。不仅仅是客服中心,2016 年,所有的市场研究人员、出版人员、研究和洞察专业人士都在不断寻找突破。可以期待,未来语音分析也将成为推动人机会话接口发展的重要力量。

六、扩展式情感分析

广告人员早就认识到情感可以改变消费者的决定,但直到近日,广泛地、系统地对于情感与决策的研究已经超越了我们的能力范围。根据你的角度,进入情感分析,或者是情感分析的子类,或者是其姊妹类。带着量化我们的情绪反应的目的,使用面部表情分析从图像和视频中(或从语音或文本中)提取我们的情感状态。这方面的服务提供商有:视频服务的 Affectiva、Emotient 和 Realeyes,语音服务的 Beyond Verbal 以及文本服务的 Kanjoya;相关的受众包括广告商、媒体、市场研究人员和代理商。

七、ISO 网络表情分析

我们已经有了文本、图像、语音、视频等,那为什么我们还要用网络表情呢?因为它们简洁、易用、生动、有趣,它们补充并且对长格式的内容形成冲击,这就是为什么互联网俚语灭亡了。Facebook 正在尝试对网络表情进行挖掘,更好的是,我们还看到了像 Line stickers 这样的变种。现在我们需要的就是网络表情分析了。这个领域的技术正在通过像 Emogi 这样的初创企业不断兴起。尽管大多数人也不过就是用计数和分类来获取网络表情语义,像 Instagram 工程师 Thomas Dimson 和斯洛文尼亚研究组织 CLARIN.SI 都是这么干的。但他们当中的一些公司,比如 SwiftKey,还是值得关注的。

八、网络 + 内容的深度洞察

这一点既是我对于 2016 年的趋势预测,同时我在 2015 年对市场研究公司 TNS 的数据科学家 Preriit Souda 访谈时也提到过。Preriit 指出:“网络为会话赋予结构,内容挖掘为其赋予含义。”洞察力源自于对于信息与连接的理解,也来自于连接是如何被激活的。因此为你的工具包加一个图形数据库和网络可视化工具吧,这就是为什么 Neo4j.js 和 Gephi 这么成功的原因。建立一个类似于 QlikView 的数据分析平台也是一个选择,一个可以协同文本和数字分析的选择,对于 2016 年来说这是一定要做的事。

九、2016 年,你会读到(或与之交互)多得多的机器编写的内容

机器编写内容的技术叫自然语言合成(Natural Language Generation,NLG),它提供根据算法从文本、数据、规则和内容中撰写文章、信件、短信息、摘要和翻译的能力。NLG 就是为大容量、高重复量的内容而生的:金融、体育和天气预报。相关的服务提供商有 Arria、Narrative Science、Automated Insights、Data2Content 和 Yseop。你也可以看看你与你心爱的虚拟助手进行对话时的机器端:Siri、Google Now、Cortana 或是 Amazon Alexa,或是自动客服、其它程序化相应系统。后面的这些系统都归类于自然语言交互(Natural Language Interaction,NLI);其中 Artificial Solutions 还是值得一看的。

十、机器翻译逐渐成熟

长久以来,人们一直希望拥有一个“星际迷航”那样的通用翻译器,但自从 1950 年科学家称机器翻译可以在 3~5 年内实现,精准的、可信赖的机器翻译就一直是个谜。(ACM Queue 撰文《Natural Language Translation at the Intersection of AI and HCI》充分地讨论了人机结合条件下机器翻译的状态)我不能说胜利就在眼前,但是多亏了大数据和机器学习,2016 年(或 2017 年)对于大多数任务来说,主流语言的机器翻译能做到足够好。这就是胜利!

总结

如果你是一个文本分析、情感分析或是社交分析学家,解决方案提供商或是用户,每一个趋势都会影响到你,无论是直接地还是间接地。因为人类的数据现在已经被编织成为我们每天赖以生存的技术网。连接这张网的线就是更多的数据,更有效地使用,来创造改变生活的机器智能。

原文转载自 Seth Grimes 的博客《10 text, sentiment, and social analytics trends for 2016》,原文作者已授权转载。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2016-02-03 19:496739

评论

发布
暂无评论
发现更多内容

VUE为什么在中国如此流行?

Speedoooo

Vue 跨端框架 小程序容器技术 跨端技术

CNCC 2023 | 五位重磅大咖齐聚沈阳,共同探讨「大模型与推荐系统」

小红书技术REDtech

人工智能 AI 算法 #推荐系统 #大模型

极狐GitLab 致敬中国 1000万程序员

极狐GitLab

1024 极狐GitLab 致敬

【Linux】进程间的通信之共享内存

百度搜索:蓝易云

Linux 云服务器 ipc Inter Communication

手把手带你打一场时间序列比赛—数据探索

打工人!

机器学习 时间序列预测

Parallels Desktop 19.1.0 最佳Mac虚拟机解决方案

晴雯哥

从昏暗到明亮—改善照明环境,提升编程效率

颜淡慕潇

程序员 1024程序员节 明基BenQ ScreenBarBar

3D模型金属度怎么调?

3D建模设计

材质 纹理 金属度

Java基础面试题【Spring】二

派大星

Java 面试题 java 技术提升

Mac电脑文件批量重命名软件 Renamer 最新中文版

mac大玩家j

Mac软件 重命名工具 文件重命名

支持M1/M2 Jump Desktop 8 Mac 远程桌面控制软件v8.10.4永久激活版

晴雯哥

Photoshop 2024 for Mac v25.1.0Beta 最新PS测试版多语言一键安装ACR 15.5.1 + Neural Filters + Ai创成式填充

晴雯哥

国际原油价格大波动,航司如何精准降低航油成本?

用友BIP

降本节能

用友iuap数据中台又获奖了! 用友

用友BIP

数据驱动

简单好用的批量重命名软件:A Better Finder Rename 12 直装激活版

胖墩儿不胖y

Mac软件 重命名工具 重命名软件 文件重命名

Zebec Protocol 薪酬支付工具 WageLink 上线,掀新一轮薪酬支付浪潮

石头财经

Java常见的锁及同步机制

echoes

IDC:用友再蝉联中国SaaS市场多项年度第一

用友BIP

企业服务

区块链积分商城系统开发

西安链酷科技

去中心化 dapp开发 #区块链

Zebec Protocol 薪酬支付工具 WageLink 上线,掀新一轮薪酬支付浪潮

鳄鱼视界

Zebec Protocol 薪酬支付工具 WageLink 上线,掀新一轮薪酬支付浪潮

BlockChain先知

Zebec Protocol 薪酬支付工具 WageLink 上线,掀新一轮薪酬支付浪潮

威廉META

Linux绝对路径和相对路径

智趣匠

Python 数组和列表:创建、访问、添加和删除数组元素

小万哥

Python 程序员 软件 后端 开发

我们距离“裸眼3D自由”,还有多远?

脑极体

XR

思辨:移动开发的未来在哪?

巫山老妖

移动开发

ubuntu系统从源码编译安装gcc7.3.0编译器?

百度搜索:蓝易云

Linux ubuntu 运维 云服务器 GCC

室内LED显示屏和户外LED显示屏亮度标准

Dylan

屏幕亮度 LED显示屏 led显示屏厂家

2023版一线大厂Java面试八股文1000+ 面试题附答案详解,最全面详细!

架构师之道

编程 计算机 java面试

数划云与明道云达成产品战略生态合作

数划云

通过 Python 脚本支持 OC 代码重构实践(一):模块调用关系分析

百度Geek说

Python 自动化 重构 脚本 企业号10月PK榜

2016年,文本分析、情感分析和社交分析的10大趋势_大数据_Seth Grimes_InfoQ精选文章