发布于: 修改于:雪球转发:5回复:24喜欢:70
搜索学习了一下notepad++的正则表达式知识,可以将冗长的财报报表或pdf报告中的长串数字和英文字符给去掉,转化为纯文字朗读版,用于快速听书了解公司历史、公司风险和管理层讨论及分析,适用于泛读财报:
notepad++正则表达式:
任意汉字 [\u4e00-\u9fa5]
英文字母[a-zA-Z]
任意数字[0-9]
任意字符[^\w\s]+匹配一个或多个非单词字符非空白字符的字符
任意两个字符x和y之间内容\bx.*?y\b
所有汉字、字母和数字内容[\u4e00-\u9fa5]
批量替换超过10位数的数字字符串(\d{10,})
参考申洲国际2023年报朗读,纯文字内容只要几十分钟就可以朗读完。
有些陌生公司的财报非常冗长,但值得了解下,利用ai朗读,可以躺着听。

精彩讨论

forcode07-01 23:26

有很多公司的财报,如果靠慢慢看,我可能很难有那么多时间一份份去读,比如英伟达的财报,我至今没读过。但了解下年报里对公司情况、公司风险、管理层经营讨论,我觉得还是有点启发的。
类似的还有微软、Google、Amazon、特斯拉、阿里巴巴、meta、苹果、迪士尼、台积电、加拿大鹅、伯克希尔、耐克等大量致命公司的年报,我都想听一听这三个部分的内容,但让我全部读一遍,恐怕没这个时间。
利用ai翻译处理完之后,每个公司只需要一二十分钟就可以朗读完。比如,英伟达的

forcode07-01 23:13

讯飞有声就够用了

forcode07-02 08:54

微信读书APP就够用了,讯飞有声我主要用于朗读几千字的剪贴板内容或网址,长内容还是保存为TXT格式导入微信读书APP朗读。

全部讨论

07-01 23:26

有很多公司的财报,如果靠慢慢看,我可能很难有那么多时间一份份去读,比如英伟达的财报,我至今没读过。但了解下年报里对公司情况、公司风险、管理层经营讨论,我觉得还是有点启发的。
类似的还有微软、Google、Amazon、特斯拉、阿里巴巴、meta、苹果、迪士尼、台积电、加拿大鹅、伯克希尔、耐克等大量致命公司的年报,我都想听一听这三个部分的内容,但让我全部读一遍,恐怕没这个时间。
利用ai翻译处理完之后,每个公司只需要一二十分钟就可以朗读完。比如,英伟达的

07-02 00:04

试了一下讯飞有声和喜马拉雅,好像后者的断句比前者好一些

07-02 09:41

刚好最近在学pyh3的正则表达式…分组、匹配、替换

07-01 23:08

佛口兄用的什么软件来听,最近发现听书确实是比看更高效的一种方式,周末花了两个小时多点听完雷布斯的创业故事

07-02 10:46

可以让kimi或其他ai工具帮助写正则表达式,不需要自己研究。

07-01 23:08

F大,这是什么App

07-02 10:40

巧了上周也正好复习了一下正则,这个匹配删除然后听财报的思路不错,很实用。

07-02 14:14

效率提升技能

07-02 09:31

学习了谢谢

07-02 08:52

sed awk 这些linux shell 工具集处理文本好方便