🤖 由 文心大模型 生成的文章摘要前文介绍了深谋科技发布的人形机器人深谋科技发布人形机器人三大核心技术——OmniSense声波传感系统、MindMo...
2025-07-27 0
20GB 内存,本地运行 DeepSeek-R1-0528
大家好,我是 Ai 学习的老章
Reddit 看到一个帖子,探讨如何极限情况下运行 DeepSeek-R1-0528
《现在你可以在本地设备上运行 DeepSeek-R1-0528 了!(最低需 20GB 内存)》
DeepSeek-R1-0528 是 DeepSeek 推出的最新推理模型,参数规模高达 671 亿(671B),性能据称可媲美 OpenAI 的 o3 和 o4-mini-high。
原始模型需要 715GB 存储空间,对硬件要求极高。通过 Unsloth 团队的动态量化技术(如 1.78-bit、2-bit 等),模型大小压缩至 168GB(约 80% 压缩),显著降低了运行门槛,使其可在消费级设备上运行。
此外,DeepSeek 还提供了基于 Qwen3 的 8B 蒸馏版本,性能接近 Qwen3(235B),适合低配设备用户
完整版 R1 的 GGUF 模型文件下载链接
完整运行指南
五、总结与展望
DeepSeek-R1-0528 通过 Unsloth 的动态量化技术实现了在消费级设备上的运行,从最低 20GB RAM 到高端 H100 配置,满足了从个人爱好者到企业用户的多样化需求。8B 蒸馏模型进一步降低了硬件门槛,使移动设备用户也能体验大模型的威力。但完整 671B 模型存在高硬件成本、蒸馏模型与原始模型的性能差距、以及移动设备运行时的稳定性问题。未来,DeepSeek 和 Unsloth 可能通过推出中型蒸馏模型(如 30B)、优化移动端支持以及增强生态兼容性,进一步提升本地大模型的普及度。
我也在期待,DeepSeek 什么时候蒸 32B?
搭建完美的写作环境:工具篇(12 章)
图解机器学习 - 中文版(72 张 PNG)
ChatGPT、大模型系列研究报告(50 个 PDF)
108 页 PDF 小册子:搭建机器学习开发环境及 Python 基础
116 页 PDF 小册子:机器学习中的概率论、统计学、线性代数
相关文章
🤖 由 文心大模型 生成的文章摘要前文介绍了深谋科技发布的人形机器人深谋科技发布人形机器人三大核心技术——OmniSense声波传感系统、MindMo...
2025-07-27 0
【通信产业网讯】(记者 高超)即将开幕的2025世界人工智能大会将再次把行业的注意力聚焦于AI。AI不仅是当下全球的科技焦点,更逐步渗透至千行万业,成...
2025-07-27 0
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。作者:乔克公众号:运维开发故事✍ 道路千万条,安全第一条。操作不规范...
2025-07-27 0
今年的笔记本移动平台可以说是热闹非凡,CPU与GPU都有重磅新品到来。CPU方面,AMD与Intel都在今年初发布了新一代高端游戏处理器,其中AMD除...
2025-07-27 0
在全球医疗创新史上,如果要选出一家真正改变“开刀”方式的公司,非直觉外科(Intuitive Surgical)莫属。1999年,它推出全球首个获批上...
2025-07-27 0
拒绝参数,只谈体验,关注导盲犬小抠,真实解读您熟悉的数码产品,本文阅读预计耗时3分钟。游戏机是很多朋友童年的时光机,在科技资讯不发达的年代里,哪怕是普...
2025-07-27 0
OPPO开放式耳夹耳机来了,两只耳机完全一致,电池仓随便放,无需分辨左右,且左右声道自适应。此外,单只耳机仅重 5.8g,OPPO Enco Clip...
2025-07-27 0
在HIFI领域当中前端设备一直都占据着和耳机本身同等重要的地位,从和手机相连接的小尾巴到便携播放器再到台机,市场上针对不同的应用场景有着茫茫多的前端设...
2025-07-27 0
发表评论