研究者July

研究者July

北京七月在线科技有限公司 创始人

北京七月在线科技有限公司 创始人

  • 3 公司 七月在线
查看更多 a
置顶 为何我司论文审稿模型可以超过GPT4
核心三点:数据第一关键,其次训练策略,最后llama 2

详见此文《用一万多条paper-review数据集微调LLaMA2》:O网页链接
至于数据集、代码则见「大模型项目开发线上营」O网页链接,70B的版本则见:O网页链接
L研究者July的微博视频 ​​​​
6月8日 17:51 来自 Xiaomi MIX 4 已编辑
为了说明白点,卖课现在只占1/3,更多是卖系统应用、卖机器人、卖解决方案,相当于从教育公司到科技公司。 //@黑崎羽亿:解决方案的课主要讲什么内容呢?
今年第十年,前8年半核心是教育,过去一年做项目,未来3-5年,课只占1/3,另外两个1/3分别是:系统应用/机器人、解决方案

因为经营思路、心态、利益的彻底开放,​从教育到科技,我迎来了更多合伙人,也是走向青史留名的开始 ​​​​
在从南京回长沙的高铁上(目前北京 长沙 南京都有团队了,各有侧重),看完了mamba2作者写的这4篇博客文章

博客​比论文通俗不少,不过感觉还可以更加通俗,我下周准备写下mamba2的解读 ​​​​
今年第十年,前8年半核心是教育,过去一年做项目,未来3-5年,课只占1/3,另外两个1/3分别是:系统应用/机器人、解决方案

因为经营思路、心态、利益的彻底开放,​从教育到科技,我迎来了更多合伙人,也是走向青史留名的开始 ​​​​
6月6日 13:49 来自 Xiaomi MIX 4 已编辑
哈哈,我们确实正准备基于GLM4、qwen1.5/2.0,搞下金融中文论文数据的审稿微调,😃
早上看到glm4开源了9b系列,所以扫了下glm4的模型代码和GLM3做了比对,从模型结构方面没有进行改动和优化,只是从28层变到40层,删掉了一个3里面的前缀编码MLP模块。 所以没有什么特殊的结构技巧,核心还是数据飞轮和训练上,且vlm模型今年依旧极速扩张,4的vl 版本仅次于internvl 的评分,更值得散户 ​​​​...展开全文c
《DexCap——斯坦福李飞飞团队泡茶机器人:更好数据收集系统的原理解析、源码剖析》O网页链接 ​​​​
历经攻机器人 组队伍 复现UMI和DexCap后,这月总算要开始为工厂赋能了

创业第十年,我司变成了科技为主,卖系统 卖机器人 卖解决方案,科技就是最直接的生产力 ​​​​
3月底,我和审稿项目组在长沙杜甫江阁上反复讨论,确定q2的主要计划,加之发现了早期paper,于是4月和5月整整两个月反复折腾,在论文审稿这个方向,我司做到了业界前沿
新blog之《从提升大模型数据质量的三大要素(含审稿GPT第4.6版、第4.8版、第5版)到Reviewer2的实现》O网页链接

毕竟,数据的重要性再怎么强调都不过分,因为数据就是项目效果上的天花板
故我们审稿项目组 在3月份疯狂微调各种模型之后,4月份再次回到数据质量的提高上 ​​​​
6月1日 01:05 来自 Xiaomi MIX 4 已编辑
今天6.1,这月把论文翻译系统、论文审稿系统分别放出去,七月官网会有体验入口

​之前本想着3-4月份推出去审稿的,结果因为我无意中发现了早期paper,结果和项目组天天折腾 ​​​​
经过「论文审稿项目」中的这么一事,再也不小看写好prompt的威力与价值了 😃 ​​​​
Y博士,机器人方向的合伙人,我两及整个机器人开发团队,对具身智能的发展 ​充满无比的信心

​赋能各个典型的工业场景 需要更多人人人 ​​​​
今天在长理,和来自湖南各高校的100多位老师交流大模型的前沿技术与实践

没有辜负现场老师们的热情(10多位老师互动),现场老师反应很有新鲜感、很有收获 2长沙·长沙理工大学 ​​​​
354人了,基本都是国内各行各司的大模型开发者
大模型项目开发线上营 [论文审稿GPT/RAG知识库问答/AI Agent等六大项目] O网页链接

其中三个都是我司各项目组迭代几月的商用落地项目 ​​​​
  • 长图
刚补充了3.1.3节中对mamba整体架构的说明,比如为什么SSM前面有个卷积?
应该是全网关于mamba最好懂的一篇了,《一文通透想颠覆Transformer的Mamba:从SSM、HiPPO、S4到Mamba》O网页链接

顺带发现Google抓的真快(搜mamba模型,已排第一) ​​​​
刚又更新了一堆细节,在不断的工程优化中有了纯纯科研的节奏了..
新blog之《从提升大模型数据质量的三大要素(含审稿GPT第4.6版、第4.8版、第5版)到Reviewer2的实现》O网页链接

毕竟,数据的重要性再怎么强调都不过分,因为数据就是项目效果上的天花板
故我们审稿项目组 在3月份疯狂微调各种模型之后,4月份再次回到数据质量的提高上 ​​​​

正在加载中,请稍候...