新重庆-重庆日报 记者 周松近日,在长江奉节段航道维护现场,工作人员手持遥控器轻轻一按,远处绝壁上的航标灯便自动升降至指定位置。这一场景已成为长江万州...
2025-10-21 0
10月20日,DeepSeek-AI团队发布并开源了名为DeepSeek-OCR的新模型。该模型提出了一种利用视觉模态压缩长文本上下文的新方法,其参数量为3B。
该模型利用视觉模态压缩长文本,仅需少量视觉token即可实现高效处理。在压缩比低于10倍时OCR精度达97%,单张A100显卡每日可处理超20万页文档,为长文本处理提供了低成本高性能的解决方案。
不久前的9月29日,DeepSeek正式发布DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。据了解,DeepSeek Sparse Attention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。
近日,美国《时代周刊》杂志公布了2025年最佳发明榜单,选出了300项年度最具影响力的创新发明36个品类,DeepSeek、宇树科技、追觅科技、雷鸟创新等20余个中国企业的产品成功入选。
今年年初,DeepSeek R1高级推理模型的横空出世,堪称AI领域的“震惊世界第一枪”。当科技巨头们近年向生成式AI项目投入数百亿美元时,这家来自杭州的初创企业“深度求索”仅用数月就打造出在行业基准测试中媲美OpenAI、当时最先进产品的模型,且宣称训练成本仅600万美元(约合人民币4268.8万元)。该模型的算力消耗仅为美国竞争对手的零头,至今仍向用户免费开放。
(羊城晚报·羊城派综合自@密度财经、澎湃新闻)
编辑:陈睿智
来源:羊城晚报•羊城派综合
相关文章
新重庆-重庆日报 记者 周松近日,在长江奉节段航道维护现场,工作人员手持遥控器轻轻一按,远处绝壁上的航标灯便自动升降至指定位置。这一场景已成为长江万州...
2025-10-21 0
随着京东11.11热度持续攀升,10月20日,由京东11.11与东方卫视联手打造,京东手机独家冠名、京东买药联合赞助、京东家电家居行业赞助的京东11....
2025-10-21 0
10月20日,DeepSeek-AI团队发布并开源了名为DeepSeek-OCR的新模型。该模型提出了一种利用视觉模态压缩长文本上下文的新方法,其参数...
2025-10-21 0
日前,董浩云智能管理与物流研究院(中美物流研究院)迎来建院二十周年纪念日,系列学术活动在上海交通大学安泰经济与管理学院举行,与会嘉宾齐聚展望智能管理与...
2025-10-21 0
记者日前从中国电信、中国移动和中国联通获悉,三家运营商已正式获得工业和信息化部eSIM手机商用试验批复许可,并在全国上线eSIM手机办理业务。 业内...
2025-10-21 0
10月20日,亚马逊云服务出现故障,导致大量应用程序无法正常运行。网络服务报告平台Downdetector官网显示,US-East-1 区域的 Ama...
2025-10-21 0
AI等前沿技术的发展,已成为城市转型升级的强大动力。研究报告显示,2015年至2023年,全球对AI初创企业的风险投资增加了两倍,从310亿美元快速上...
2025-10-21 0
当你还在为错过淘宝、微商和直播带货而惋惜时,一个更庞大、更确定、更汹涌的财富浪潮已扑面而来——"银发经济"。而其中最具爆发潜力的两大分支,当属"孤独经...
2025-10-21 0
发表评论