自小米13开始成功,小米14大卖开始。行业内特别是国产品牌基本上全面开始做小屏手机,但是做小屏不仅仅是把屏幕做小,对于品牌也是极大的考验。要不行业根本...
2025-07-12 0
DeepSeek R1[1]是一个功能强大且用途广泛的 AI 模型,它凭借先进的推理能力、成本效益和开源可用性向 OpenAI 等老牌企业发起了挑战。虽然它有一些局限性,但其创新的方法和强大的性能使其成为开发人员、研究人员和企业的宝贵工具。对于那些有兴趣探索其功能的人来说,该模型及其精简版本可以在 Hugging Face 和 GitHub 等平台上获得。
由受 GPU 限制的中国团队训练,它在数学、编码甚至一些相当复杂的推理方面表现出色。最有趣的是,它是一个“精简”模型,这意味着它比它所基于的巨型模型更小、更高效。这很重要,因为它使人们在实际使用和构建它时更加实用。
本文我们将介绍
我们将使用 LlamaEdge[2](Rust + Wasm 技术栈)来开发和部署这个模型的应用程序。无需安装复杂的 Python 包或 C++ 工具链[3]!了解我们选择这项技术的原因[4]。
第一步: 通过以下命令行安装WasmEge[5]。
curl -sSf https://raw.githubusercontent.com/WasmEdge/WasmEdge/master/utils/install_v2.sh | bash -s -- -v 0.14.1
第二步:下载量化过的DeepSeek-R1-Distill-Llama-8B-GGUF[6]模型文件。 这可能需要一定时间,因为模型的大小为 5.73 GB。
curl -LO https://huggingface.co/second-state/DeepSeek-R1-Distill-Llama-8B-GGUF/resolve/main/DeepSeek-R1-Distill-Llama-8B-Q5_K_M.gguf`
第三步:下载 LlamaEdge API 服务器应用程序。它也是一个跨平台的便可移植的 Wasm 应用程序,可以在许多 CPU 和 GPU 设备上运行。
curl -LO https://github.com/LlamaEdge/LlamaEdge/releases/latest/download/llama-api-server.wasm
第四步: 下载chatbot UI,以便在浏览器中与 DeepSeek-R1-Distill-Llama-8B 模型进行交互。
curl -LO https://github.com/LlamaEdge/chatbot-ui/releases/latest/download/chatbot-ui.tar.gztar xzf chatbot-ui.tar.gzrm chatbot-ui.tar.gz
接下来,使用以下命令行为模型启动 LlamaEdge API 服务器。
wasmedge --dir .:. --nn-preload default:GGML:AUTO:DeepSeek-R1-Distill-Llama-8B-Q5_K_M.gguf \ llama-api-server.wasm \ --prompt-template llama-3-chat \ --ctx-size 8096
然后,打开浏览器访问 http://localhost:8080[7] 开始聊天!
或者可以向模型发送 API 请求。
curl -X POST http://localhost:8080/v1/chat/completions \ -H 'accept:application/json' \ -H 'Content-Type: application/json' \ -d '{"messages":[{"role":"system", "content": "You are a helpful assistant."}, {"role":"user", "content": "What is the capital of France?"}], "model": "DeepSeek-R1-Distill-Llama-8B"}' {"id":"chatcmpl-68158f69-8577-4da2-a24b-ae8614f88fea","object":"chat.completion","created":1737533170,"model":"default","choices":[{"index":0,"message":{"content":"The capital of France is Paris.\n</think>\n\nThe capital of France is Paris.<|end▁of▁sentence|>","role":"assistant"},"finish_reason":"stop","logprobs":null}],"usage":{"prompt_tokens":34,"completion_tokens":18,"total_tokens":52}}
LlamaEdge 是轻量级的,不需要守护进程或 sudo 进程即可运行。它可以轻松嵌入到您自己的应用程序中!通过支持聊天和 embedding 模型,LlamaEdge 可以成为本地计算机上应用程序内部的 OpenAI API 替代品!
接下来,我们将展示如何为 DeepSeek-R1 模型以及 embedding 模型启动完整的 API 服务器。API 服务器将具有 chat/completions 和 embeddings 端点。除了上一节中的步骤之外,我们还需要:
第五步:下载 embedding 模型。
curl -LO https://huggingface.co/second-state/Nomic-embed-text-v1.5-Embedding-GGUF/resolve/main/nomic-embed-text-v1.5.f16.gguf
然后,我们可以使用以下命令行启动具有聊天和 embedding 模型的 LlamaEdge API 服务器。更详细的说明,请查看文档——启动 LlamaEdge API 服务[8]。
wasmedge --dir .:. \ --nn-preload default:GGML:AUTO:DeepSeek-R1-Distill-Llama-8B-Q5_K_M.gguf \ --nn-preload embedding:GGML:AUTO:nomic-embed-text-v1.5.f16.gguf \ llama-api-server.wasm -p llama-3-chat,embedding \ --model-name DeepSeek-R1-Distill-Llama-8B,nomic-embed-text-v1.5.f16 \ --ctx-size 8192,8192 \ --batch-size 128,8192 \ --log-prompts --log-stat
最后,可以按照这些教程将 LlamaEdge API 服务器作为 OpenAI 的替代与其他 Agent 框架集成。具体来说,在你的应用或 Agent 配置中使用以下值来替换 OpenAI API。
Config option 值 Base API URL http://localhost:8080/v1 --- --- 模型名称 (大模型) DeepSeek-R1-Distill-Llama-8B 模型名称(文本 embedding) nomic-embed
就是这样啦!立即访问 LlamaEdge 仓库并构建你的第一个 AI Agent!如果觉得有意思,请在此处为我们的repo[9]加注星标。在运行此模型时有任何问题,也可以请前往该 repo 提出问题或与我们预约演示,以跨设备运行自己的 LLM!
参考资料
[1]
DeepSeek R1: https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Llama-8B
[2]
LlamaEdge: https://link.zhihu.com/?target=https%3A//github.com/second-state/LlamaEdge/
[3]
工具链: https://zhida.zhihu.com/search?content_id=249066187&content_type=Article&match_order=1&q=%E5%B7%A5%E5%85%B7%E9%93%BE&zhida_source=entity
[4]
选择这项技术的原因: https://www.secondstate.io/articles/wasm-runtime-agi/
[5]
WasmEge: https://github.com/WasmEdge/WasmEdge
[6]
DeepSeek-R1-Distill-Llama-8B-GGUF: https://huggingface.co/second-state/DeepSeek-R1-Distill-Llama-8B-GGUF/
[7]
http://localhost:8080: http://localhost:8080/
[8]
启动 LlamaEdge API 服务: https://llamaedge.com/docs/user-guide/openai-api/intro/
[9]
repo: https://github.com/LlamaEdge/LlamaEdge
相关文章
自小米13开始成功,小米14大卖开始。行业内特别是国产品牌基本上全面开始做小屏手机,但是做小屏不仅仅是把屏幕做小,对于品牌也是极大的考验。要不行业根本...
2025-07-12 0
凌晨1点的便利店,32岁的小林捏着找零的3枚硬币塞进裤兜,转身时硬币硌得大腿生疼。这是他这个月第17次在便利店买宵夜,每次23元的关东煮,每次找零的硬...
2025-07-12 0
7月11日,天津一数码产品专卖店里,有网友拍下一位白发婆婆在手机店里用店里的平板,熟练的敲着代码。据网友讲述,自己吃饭前就和朋友看见这位奶奶在敲平板了...
2025-07-12 0
当下折叠屏手机市场竞争激烈,大家不禁都看花了眼:折叠屏谁更有性价比,谁更值得购买?今天,PConline要给大家介绍的OPPO Find N5,凭借轻...
2025-07-12 2
人工智能作为新一轮科技革命和产业变革的关键力量,正深刻重塑各行业发展格局。7月11日,以“引领智能升级 共建美好无锡”为主题的华为云城市峰会2025·...
2025-07-12 1
南京长江大桥和武汉长江大桥,作为长江之上“爷爷辈”的里程碑级桥梁,“万里长江第一桥”的荣誉称号,究竟该花落谁家呢?武汉长江大桥根据中铁大桥局数据显示,...
2025-07-12 0
华为正再度进军英伟达主导的海外市场,以拓展其AI芯片全球版图。尽管昇腾芯片在国内已建立庞大客户群,但这家科技巨头正谋求在海外市场建立新据点。据悉,华为...
2025-07-12 0
今天给各位分享雀神麻将有没有开挂的知识,其中也会对雀神麻将能开挂真的么进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!雀神币能加...
2025-07-12 1
发表评论