盘在树上睡觉的蛇

盘在树上睡觉的蛇

他的全部讨论

24年3月收盘总结

投资风格:赚企业价值成长或分红为主,持有少量博弈仓位。
交易风格:自上而下仓位控制行业强制分散,持股适度分散,类金字塔网格
本月收益回血1.6%,本月跑赢恒生指数和沪深300。(最后一天港股停止交易,目测持仓涨跌大致会持平)。
目前持仓407.15万,净资产399.9万,仓位101.7%,今...

讨论

约占中国企业总成本的30%左右?这个数字感觉不对。
一般极端化算法都是社保相关缴费占人力成本的45%(注意这算法其实不对,因为住房公积金和医保都是某种程度能到个人账上的,因此会和无社保的到手收入做直接比较。)
即使这样,这个上海商超的人力成本占比到了? 30/45=66.7%,不太符合常...

讨论

回复@泡沫艺术家: 为啥8bit,5.65-6 bit是甜点区域,损失相当低。对应GGUF格式的Q5_K_M或者exl2的6bit。
70B的4bit也能用。
还有更低的量化,如果只是为了创造性写作,也某种程度上凑合。//@泡沫艺术家:回复@男巫z:早着了,本地部署能靠谱点的14B语言模型使用INT8量化优化后显存,大概也需...

讨论

4月第三周总结
今年亏损2.5%,目前仓位100.8%,今年主要亏损在地产及港股,继续等待A/H指数收窄,地产已进入停网状态。
6月底之前,考虑整体的持仓规划。适当时候考虑斩仓一半以上地产。
现在赌翻转的仓位稍偏高,除了传统的猪肉占了25%。其它军工、风力主机、港股科技、锂矿、医药、...

讨论

我刚刚关注了股票$石英股份(SH603688)$,当前价 ¥94.42。

讨论

预训练阶段的算力需求和训练用token及网络参数数量同时相关,并且很多时候会为不同质量的数据设定标签,训练不同的轮数甚至学习率。
不同时代SoTA模型的预训练用的总token数。
llama 1: 7B 1T, 33B/65B 1.4T
llama 2: 7/13/70B 2T;Benchmark上 llama2 7B ~= llama1 13B
Mistral 7...

讨论

今天换了大部分$万科A(SZ000002)$ 到港股$万科企业(02202)$ (之前买成两边各一半了),剩下的万科A只够做3次小网格了。

讨论

Kimi我也在试用,不过主要模式是把gpt3.5/4 问出来的问题扔给它看看能不能也回答正确。
这几天下来,感觉基本上有gpt-3.5的能力了,是否更强暂时还是没感觉。
杨的激进在于,他仍然相信One Model Rules All,市场匹配上的积累,可能会被模型的进步直接取代,各类领域微调(FineTune),会...

讨论

回复@非典型伪价值投机: “经济人口向着一线城市汇聚,这是经济客观规律”,总不可能无限制的聚集吧,这个规律的边界条件是?现在是否到了边界?
一线人口能否在无平民窟的情况下保持自己的再生产?就我所知,纽约也是做不到的。
如果不行,那么所谓的“转移支付”,多少是应该给付的三四...

24年2月收盘总结

投资风格:赚企业价值成长或分红为主,持有少量博弈仓位。
交易风格:自上而下仓位控制行业强制分散,持股适度分散,类金字塔网格
本月收益回血6.2%,本月跑输恒生指数和沪深300。A股在2月5日低点依靠融资正常密集加仓,考虑做部分估值切换但是犹豫了,第二天已经没有合适价差了。
但...

讨论

回复@老刘该睡觉了: 为啥非得从两个”砖家“里面选一个呢?
设置议题就意味着引导。
单纯这个问题,类似项有 19世纪晚期的德国、冷战期的东亚中的日、韩及台湾地区;反面项有奥斯曼土耳其、菲律宾、拉美/非洲;印度可以作为中立项对比。
我们的制度里面,哪些加速了这种跨越式发展,我...

讨论

字节跳动自研51.2T交换机上线
硬件采用 JDM + CM 模式研发,软件则是字节跳动自研的 Lambda OS。51.2T 800G 自研交换机是字节跳动网络工程团队自研的最新一代产品。
这个背后的硬件商是谁?
#光模块#

讨论

干得好

讨论

说点自己知道的,仅供山神参考
算力部分,推理其实相对好取代一点,vllm这类推理框架也在慢慢加入RCom的支持,重要的是推理是小批次(最多也就推理1M token了,常见推理也就1~4k上下文,吐出1k token)但是完全趋同的操作,人力投入是一次性的,一旦兼容了,出问题几率较小。
而训练部分人...

讨论

如果不满意教材,推荐买本《数学家讲解小学数学》自己教一点

关于SORA和国内外AIGC差距的一点看法

#Sora # #AIGC概念#
春节Sora刷屏,因为没有开放使用,到底在什么水平不知道,但是嚷嚷世界规律我感觉太早。
单独看论文,基于像素级别,是否能否真的像词向量大语言模型那样涌现出世界规律我持保留态度。毕竟词向量模型中代码加入训练语料对其逻辑能力有很大贡献,即使如此其逻辑能力仍然...

讨论

回复@contactet: 在财经网站跨界评论未免有点超出能力圈指点江山的味道。
272事件前后看看枪迷论坛对其的称呼,现在通常还是死鱼眼指代272。//@contactet:回复@contactet:这么多历届国家队里面,要说真没有r的,阿根廷肯定是能排前面的。尤其那德国,好几个r了,272,但在中国人气依然不减。所...

讨论

电费中隐含的税很高吗?

讨论

春节快乐,大家总算可以好好过年了

讨论

$沪深300(SH000300)$ 有种含在嘴里的棒棒糖被人抢走感觉 [哭泣]