大家好,我是很帅的狐狸
今天分享一个免费政策分析工具。
这个工具是我(和ChatGPT)做的,用来比较两段文本的词频。
如果你的工作涉及宏观政策分析,这个工具会很好用。
所有代码都是用ChatGPT写的(包括前端),花了大概1个多小时吧。
地址在这:网页链接
先说说底层的分析原理——
我在之前几期的 政策分析课 上有提到过,分析政策文件有一个做法是「词频分析法」,也就是通过词语出现频次判断重要性。
这个方法,可以用来对比同级别会议或报告。
比如说,对比过去几年的国家五年规划文件,我们可以发现制造业和服务业的地位有所扭转——
过往这个分析基本靠网上的词频分析工具,不过大多都是付费的。
所以我这次手搓了一个免费的。
用法也很简单:
把最新文件(比如「十四五」规划文件)和想要对比的文件(比如「十三五」规划文件)分别贴在两个文本框——
接着可以选择要统计的高频词的个数(最少10个),还有看看是不是要用相对词频(也就是把词频除以文件的总字数,这样算出来的是百分比)。
我们也可以根据需求,看看是不是要改改分词用的词典。
接着按「词频比较」按钮就可以了。
会生成类似下面的图表(黑色的是「十四五」,黄色的是「十三五」,可以看一眼哪些是新增哪些减少了,还挺好玩的):
服务器不会储存你贴的任何文本,请放心使用。
如果实在不放心,我也把代码都开源到了github(网页链接)。
略懂python的话,也可以在自己电脑上部署。
P.S.最近更新得是比较低频,so,也欢迎关注我们团队每个工作日都更新的日报内容——
「Greed is good.」
「很帅的投资客」的所有内容皆仅以传递知识与金融教育为目的,不构成任何投资建议。一切请以最新文章为准。
相关阅读:
《聊几句政府工作报告》《中国的未来:走向效率型增长》《房地产税要来了吗?》
✍ 图文/@狐狸君raphael,曾供职于麦肯锡金融机构组,也在 Google 和 VC 打过杂。华尔街见闻、36氪、新浪财经、南方周末、Linkedin等媒体专栏作者,著有畅销书《风口上的猪》《无现金时代》。
觉得对你有用的话,帮我点个在看吧