【D】文本分析常用软件
优采云 发布时间: 2022-05-29 07:52【D】文本分析常用软件
在信息化时代,迅速从海量文本中抽取出有价值的信息成为一项重要技能,文本分析技术逐渐彰显出其巨大的应用价值和发展空间,受到管理学等领域的广泛关注。但对于非技术人员而言,运用编程语言是一个门槛极高的过程,可以借助简单、易操作的文本分析软件进行文本挖掘与处理,从文本中捕获关键要素,下面分享几款常用的文本分析软件:
1NLPIR
NLPIR为“自然语言处理与信息检索共享平台”的英文缩写,它是一个中文语义分析工具,针对大数据内容采编挖搜的综合需求,融合了网络精准采集、自然语言理解、文本挖掘和网络搜索技术等最新研究成果。
NLPIR的功能特点:包括网络抓取、正文提取、中英文分词、词性标注、实体抽取、词频统计、关键词提取、语义信息抽取、文本分类、情感分析、语义深度扩展、繁简编码转换、自动注音、文本聚类等功能,提供客户端工具、云服务、二次开发接口。所有功能模块全部备有对应的二次开发接口(动态链接库.dll,.so,及静态链接库等形式),平台的各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD,麒麟等不同操作系统,开发者还可使用Java,C/C++,C#, Python,Php, R等各类主流开发语言调用其所有功能。
官方网站:
平台需求:软件支持Windows/MAC系统,也可在线使用
2WORDij
WORDij是一套数据科学程序,可自动、轻松处理自然语言,包括来自社交媒体、新闻、演讲、焦点小组、采访、电子邮件、网站等来源的非结构化文本,可以帮助分析词共现和网络分析。
WORDij的功能特点:运行速度快(包含10个或100个文档的小文件可以在几秒钟内运行),分析的文件格式为UTF-8(可以处理带有图形字符的语言,如汉语、日语、阿拉伯语或俄语),处理更精准,保留了字母组合中的单词顺序并嵌入语法效果等,在学术研究中应用是免费的,其他功能介绍可下载后在Documentation文件夹中的教程文件中进行学习。
官方网站:
平台需求:软件支持Windows/Mac系统
3Datamate Text Parser Lite
Datamate Text Parser for Mac是一款在Mac上的文本分析器,这款软件功能强大且易于使用,它可以帮助你进行文本数据分析,支持从电脑文件、实时网页中提取数据信息,可以批量处理多个文件或网页,并将输入源数据粘贴至文本中使用,功能强大,易于使用。
Datamate Text Parser for Mac的功能特点:软件界面简洁、操作简单,从文件、网页或粘贴的文本中提取数据,批量处理多个文件或网页,保存和载入文件路径、网页的网址、解析规则,提供帮助文件,解决用户问题,解析规则可区分大小写,添加开头和结尾的文本、标签的输出以及添加自定义分隔符输出元素。
下载网站:
平台需求:软件支持Mac系统
4微词云
“微词云”是一个非常实用并且操作简单的在线文字云图生成网站,不需要懂任何代码程序,只要把文本内容复制导入到“微词云”中就可以完成词频统计,而且可以帮助轻松制作高大上的文字云图片。
“微词云”的功能特点:不仅支持百万大文本分词(最高上传文本量20M)、多维度筛词(过滤未知词、根据不同词性进行过滤词)、自定义词典(分析更精准),还支持词频统计及分析(支持下载全部的分词词频统计结果),绘制词云图,通过智能排版、插图特效、画板个性编辑。但是“微词云”需要注册,免费的图片带有水印,而且对词汇数量有限制,不过满足大部分需求是没有问题的。
官方网站:
平台需求:支持在线使用
荐: