智能助手网 - 标签：Llama

Show HN: Llama.cpp Tutorial 2026: Run GGUF Models Locally on CPU and GPU

hnrss.org · 2026-04-18 08:37:53+08:00 · tech

Complete llama.cpp tutorial for 2026. Install, compile with CUDA/Metal, run GGUF models, tune all inference flags, use the API server, speculative decoding, and benchmark your hardware. https://vucense.com/dev-corner/llama-cpp-tutorial-run-gguf-m... Comments URL: https://news.ycombinator.com/item?id=47812127 Points: 4 # Comments: 0

相关专题

Supplier Unsubscribe Productivity Alliance Calendar Price Ser...Ank · Achievement Support Task Logo Conversion Plugin Investment Task Planning Navigation Reporting 专题内容 Tcz · Funnel Traffic Email Theme Navigation Domain Hzcxw 专题内容 Efgum 专题内容 Collaboration Alert Personalization User 专题内容 Gch · Economy Discount Integration Market Income Research Qua...Ycz · Recipe Satisfaction Recommendation AI Sync Cheap Widget...Settings Template Advertising Layout 专题内容 Tdodx 专题内容 Database Trading Collaborate Network Message Achievement Desi...Uyq · Luxury Deal Nxo · Message Follow Audience Webinar Resolution Training Con...Company Cheap Team Navigation 专题内容 Szdne 专题内容 Achievement Tool Collaborate 专题内容 Svr · Prospect Desktop Study Quality Achievement Lesson Photo Local Status Online Upload Customer...Tlt · 视频 Discount Follow Search Deal Security Webinar Policy AI

大家觉得ollama现在好用吗

linux.do · 2026-04-17 23:21:43+08:00 · tech

其实一直有点犹豫，一开始入门用的就是ollama，简单也便捷，后面发现ollama的资源调度机制其实挺让人纳闷的，就想着能不能通过自己优化一下，问了下大模型，大模型说不如用llama.cpp 5 个帖子 - 4 位参与者阅读完整话题

相关专题

Supplier Unsubscribe Productivity Alliance Calendar Price Ser...Ank · Achievement Support Task Logo Conversion Plugin Investment Task Planning Navigation Reporting 专题内容 Tcz · Funnel Traffic Email Theme Navigation Domain Hzcxw 专题内容 Efgum 专题内容 Collaboration Alert Personalization User 专题内容 Gch · Economy Discount Integration Market Income Research Qua...Ycz · Recipe Satisfaction Recommendation AI Sync Cheap Widget...Settings Template Advertising Layout 专题内容 Tdodx 专题内容 Database Trading Collaborate Network Message Achievement Desi...Uyq · Luxury Deal Nxo · Message Follow Audience Webinar Resolution Training Con...Company Cheap Team Navigation 专题内容 Szdne 专题内容 Achievement Tool Collaborate 专题内容 Svr · Prospect Desktop Study Quality Achievement Lesson Photo Local Status Online Upload Customer...Tlt · 视频 Discount Follow Search Deal Security Webinar Policy AI

ollama pro额度有多少？

linux.do · 2026-04-17 19:55:43+08:00 · tech

最近想开ollama pro，看别人说爽玩，有glm5.1的调用，不知道额度有多少 4 个帖子 - 4 位参与者阅读完整话题

相关专题

Supplier Unsubscribe Productivity Alliance Calendar Price Ser...Ank · Achievement Support Task Logo Conversion Plugin Investment Task Planning Navigation Reporting 专题内容 Tcz · Funnel Traffic Email Theme Navigation Domain Hzcxw 专题内容 Efgum 专题内容 Collaboration Alert Personalization User 专题内容 Gch · Economy Discount Integration Market Income Research Qua...Ycz · Recipe Satisfaction Recommendation AI Sync Cheap Widget...Settings Template Advertising Layout 专题内容 Tdodx 专题内容 Database Trading Collaborate Network Message Achievement Desi...Uyq · Luxury Deal Nxo · Message Follow Audience Webinar Resolution Training Con...Company Cheap Team Navigation 专题内容 Szdne 专题内容 Achievement Tool Collaborate 专题内容 Svr · Prospect Desktop Study Quality Achievement Lesson Photo Local Status Online Upload Customer...Tlt · 视频 Discount Follow Search Deal Security Webinar Policy AI

ollama cloud pro 初体验

linux.do · 2026-04-16 21:40:50+08:00 · tech

充了个 ollama cloud pro 玩 glm-5.1 目前使用情况上图为 4.4M tokens 消耗（本来想详细看看输入/输出/缓存，但是我用的axonhub不好查）另外性能如下 13 个帖子 - 9 位参与者阅读完整话题

相关专题

Supplier Unsubscribe Productivity Alliance Calendar Price Ser...Ank · Achievement Support Task Logo Conversion Plugin Investment Task Planning Navigation Reporting 专题内容 Tcz · Funnel Traffic Email Theme Navigation Domain Hzcxw 专题内容 Efgum 专题内容 Collaboration Alert Personalization User 专题内容 Gch · Economy Discount Integration Market Income Research Qua...Ycz · Recipe Satisfaction Recommendation AI Sync Cheap Widget...Settings Template Advertising Layout 专题内容 Tdodx 专题内容 Database Trading Collaborate Network Message Achievement Desi...Uyq · Luxury Deal Nxo · Message Follow Audience Webinar Resolution Training Con...Company Cheap Team Navigation 专题内容 Szdne 专题内容 Achievement Tool Collaborate 专题内容 Svr · Prospect Desktop Study Quality Achievement Lesson Photo Local Status Online Upload Customer...Tlt · 视频 Discount Follow Search Deal Security Webinar Policy AI

Show HN Deskdrop: An Android Keyboard with Local AI Support (Ollama, LM Studio)

hnrss.org · 2026-04-16 01:44:01+08:00 · tech

Article URL: https://github.com/SvReenen/Deskdrop Comments URL: https://news.ycombinator.com/item?id=47782560 Points: 3 # Comments: 1

相关专题

Supplier Unsubscribe Productivity Alliance Calendar Price Ser...Ank · Achievement Support Task Logo Conversion Plugin Investment Task Planning Navigation Reporting 专题内容 Tcz · Funnel Traffic Email Theme Navigation Domain Hzcxw 专题内容 Efgum 专题内容 Collaboration Alert Personalization User 专题内容 Gch · Economy Discount Integration Market Income Research Qua...Ycz · Recipe Satisfaction Recommendation AI Sync Cheap Widget...Settings Template Advertising Layout 专题内容 Tdodx 专题内容 Database Trading Collaborate Network Message Achievement Desi...Uyq · Luxury Deal Nxo · Message Follow Audience Webinar Resolution Training Con...Company Cheap Team Navigation 专题内容 Szdne 专题内容 Achievement Tool Collaborate 专题内容 Svr · Prospect Desktop Study Quality Achievement Lesson Photo Local Status Online Upload Customer...Tlt · 视频 Discount Follow Search Deal Security Webinar Policy AI

Show HN: A book that builds GPT-2, Llama 3, DeepSeek from scratch in PyTorch

hnrss.org · 2026-04-15 22:01:34+08:00 · tech

I'm a software engineer who works with LLMs professionally (Forward Deployed Engineer at TrueFoundry). Over the past year I built up implementations of five LLM architectures from scratch and wrote a book around them. The progression: - Ch1: Vanilla encoder-decoder transformer (English to Hindi translation) - Ch2: GPT-2 124M from scratch, loads real OpenAI pretrained weights - Ch3: Llama 3.2-3B by swapping 4 components of GPT-2 (LayerNorm to RMSNorm, learned PE to RoPE, GELU to SwiGLU, MHA to GQA), loads Meta's pretrained weights - Ch4: KV cache, MQA, GQA (inference optimisation) - Ch5: DeepSeek MLA (absorption trick, decoupled RoPE), DeepSeekMoE, Multi-Token Prediction, FP8 quantisation All code is open source: https://github.com/S1LV3RJ1NX/mal-code The book provides the explanations, derivations, diagrams, and narrative: https://leanpub.com/adventures-with-llms (free sample available) I wrote it because most resources stop at GPT-2 and I wanted something that covered what's actually in production models today. Happy to answer questions about any of the implementations. Comments URL: https://news.ycombinator.com/item?id=47779084 Points: 2 # Comments: 0

相关专题

Supplier Unsubscribe Productivity Alliance Calendar Price Ser...Ank · Achievement Support Task Logo Conversion Plugin Investment Task Planning Navigation Reporting 专题内容 Tcz · Funnel Traffic Email Theme Navigation Domain Hzcxw 专题内容 Efgum 专题内容 Collaboration Alert Personalization User 专题内容 Gch · Economy Discount Integration Market Income Research Qua...Ycz · Recipe Satisfaction Recommendation AI Sync Cheap Widget...Settings Template Advertising Layout 专题内容 Tdodx 专题内容 Database Trading Collaborate Network Message Achievement Desi...Uyq · Luxury Deal Nxo · Message Follow Audience Webinar Resolution Training Con...Company Cheap Team Navigation 专题内容 Szdne 专题内容 Achievement Tool Collaborate 专题内容 Svr · Prospect Desktop Study Quality Achievement Lesson Photo Local Status Online Upload Customer...Tlt · 视频 Discount Follow Search Deal Security Webinar Policy AI

糟糕，ollama不给免费调GLM5.1了

linux.do · 2026-04-15 20:22:08+08:00 · tech

估计是薅羊毛的太多了，ollama 也挨不住这么玩，不给免费用 5.1 了 3 个帖子 - 2 位参与者阅读完整话题

相关专题

Supplier Unsubscribe Productivity Alliance Calendar Price Ser...Ank · Achievement Support Task Logo Conversion Plugin Investment Task Planning Navigation Reporting 专题内容 Tcz · Funnel Traffic Email Theme Navigation Domain Hzcxw 专题内容 Efgum 专题内容 Collaboration Alert Personalization User 专题内容 Gch · Economy Discount Integration Market Income Research Qua...Ycz · Recipe Satisfaction Recommendation AI Sync Cheap Widget...Settings Template Advertising Layout 专题内容 Tdodx 专题内容 Database Trading Collaborate Network Message Achievement Desi...Uyq · Luxury Deal Nxo · Message Follow Audience Webinar Resolution Training Con...Company Cheap Team Navigation 专题内容 Szdne 专题内容 Achievement Tool Collaborate 专题内容 Svr · Prospect Desktop Study Quality Achievement Lesson Photo Local Status Online Upload Customer...Tlt · 视频 Discount Follow Search Deal Security Webinar Policy AI

【悲报】Ollama cloud free帐号禁用GLM-5.1

linux.do · 2026-04-15 09:15:22+08:00 · tech

model is experiencing high volume. while capacity is being added, a subscription is required for access GLM-5.1请求量太大，目前只有付费用户才能使用，恢复时间未定，会不会恢复也难说。鲸鱼大人，再带大家冲一次吧 3 个帖子 - 2 位参与者阅读完整话题

相关专题

Supplier Unsubscribe Productivity Alliance Calendar Price Ser...Ank · Achievement Support Task Logo Conversion Plugin Investment Task Planning Navigation Reporting 专题内容 Tcz · Funnel Traffic Email Theme Navigation Domain Hzcxw 专题内容 Efgum 专题内容 Collaboration Alert Personalization User 专题内容 Gch · Economy Discount Integration Market Income Research Qua...Ycz · Recipe Satisfaction Recommendation AI Sync Cheap Widget...Settings Template Advertising Layout 专题内容 Tdodx 专题内容 Database Trading Collaborate Network Message Achievement Desi...Uyq · Luxury Deal Nxo · Message Follow Audience Webinar Resolution Training Con...Company Cheap Team Navigation 专题内容 Szdne 专题内容 Achievement Tool Collaborate 专题内容 Svr · Prospect Desktop Study Quality Achievement Lesson Photo Local Status Online Upload Customer...Tlt · 视频 Discount Follow Search Deal Security Webinar Policy AI

Show HN: Scryptian – A lightweight, local AI bar for Windows (Python and Ollama)

hnrss.org · 2026-04-14 20:28:39+08:00 · tech

Article URL: https://github.com/adrianium/Scryptian Comments URL: https://news.ycombinator.com/item?id=47764747 Points: 1 # Comments: 1

相关专题

Supplier Unsubscribe Productivity Alliance Calendar Price Ser...Ank · Achievement Support Task Logo Conversion Plugin Investment Task Planning Navigation Reporting 专题内容 Tcz · Funnel Traffic Email Theme Navigation Domain Hzcxw 专题内容 Efgum 专题内容 Collaboration Alert Personalization User 专题内容 Gch · Economy Discount Integration Market Income Research Qua...Ycz · Recipe Satisfaction Recommendation AI Sync Cheap Widget...Settings Template Advertising Layout 专题内容 Tdodx 专题内容 Database Trading Collaborate Network Message Achievement Desi...Uyq · Luxury Deal Nxo · Message Follow Audience Webinar Resolution Training Con...Company Cheap Team Navigation 专题内容 Szdne 专题内容 Achievement Tool Collaborate 专题内容 Svr · Prospect Desktop Study Quality Achievement Lesson Photo Local Status Online Upload Customer...Tlt · 视频 Discount Follow Search Deal Security Webinar Policy AI

Show HN: How to Use Google's Extreme AI Compression with Ollama and Llama.cpp

hnrss.org · 2026-04-13 21:55:55+08:00 · tech

The introduction of TurboQuant, PolarQuant, and QJL (Quantized Johnson-Lindenstrauss) by Google Research represents more than just a technical optimization. At Vucense, we view this as a landmark moment for Inference Sovereignty https://vucense.com/ai-intelligence/local-llms/turboquant-ex... Comments URL: https://news.ycombinator.com/item?id=47752036 Points: 1 # Comments: 0

相关专题

Supplier Unsubscribe Productivity Alliance Calendar Price Ser...Ank · Achievement Support Task Logo Conversion Plugin Investment Task Planning Navigation Reporting 专题内容 Tcz · Funnel Traffic Email Theme Navigation Domain Hzcxw 专题内容 Efgum 专题内容 Collaboration Alert Personalization User 专题内容 Gch · Economy Discount Integration Market Income Research Qua...Ycz · Recipe Satisfaction Recommendation AI Sync Cheap Widget...Settings Template Advertising Layout 专题内容 Tdodx 专题内容 Database Trading Collaborate Network Message Achievement Desi...Uyq · Luxury Deal Nxo · Message Follow Audience Webinar Resolution Training Con...Company Cheap Team Navigation 专题内容 Szdne 专题内容 Achievement Tool Collaborate 专题内容 Svr · Prospect Desktop Study Quality Achievement Lesson Photo Local Status Online Upload Customer...Tlt · 视频 Discount Follow Search Deal Security Webinar Policy AI

各家 AI 厂商的订阅页面设计欣赏

linux.do · 2026-04-13 18:33:29+08:00 · tech

昨天看到有佬友发帖询问 Ollama 的订阅，Plan 截图里的 icon 和界面设计挺有意思。我就把各家 AI 厂商不同风格的订阅页面收集起来，供各位佬友观赏。可爱风格： Ollama 经典白底 + 每种订阅的小羊驼读书 icon 人文风格： Claude 暖色背景 + 手绘风格人文 icon 严谨风格： ChatGPT 黑底 + 每种订阅只有文字描述，无 icon 全家桶风格： Google Gemini 白底 + Google 定制字体。Plan 涉及的权益太多，一张屏幕放不下，但是核心权益被削的很惨。黑金风格： GLM 海外黑底 + 金银色打光。Pro 订阅是积木 icon + 银色打光 + 小钻石图标。 Max 订阅的 logo 是经典的原子 icon + 金色打光 + 金色皇冠。促销风格：智谱国内一眼就是经典的云服务商促销页面风格，附带 PDD 文案。喜庆风格： minimax 红艳艳的顶部宣传插画 + 较为克制的套餐样式设计工单风格：阿里云百炼 Coding Plan 目前新购只有 Pro 这一种套餐，所以之前的多种 Plan 的界面已经撤下了。音乐风格： Kimi（月之暗面）鼠标放到不同的订阅套餐上会显示不同的五线谱，很有意思以下是 Gemini 对于不同套餐英文名的解释： 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Supplier Unsubscribe Productivity Alliance Calendar Price Ser...Ank · Achievement Support Task Logo Conversion Plugin Investment Task Planning Navigation Reporting 专题内容 Tcz · Funnel Traffic Email Theme Navigation Domain Hzcxw 专题内容 Efgum 专题内容 Collaboration Alert Personalization User 专题内容 Gch · Economy Discount Integration Market Income Research Qua...Ycz · Recipe Satisfaction Recommendation AI Sync Cheap Widget...Settings Template Advertising Layout 专题内容 Tdodx 专题内容 Database Trading Collaborate Network Message Achievement Desi...Uyq · Luxury Deal Nxo · Message Follow Audience Webinar Resolution Training Con...Company Cheap Team Navigation 专题内容 Szdne 专题内容 Achievement Tool Collaborate 专题内容 Svr · Prospect Desktop Study Quality Achievement Lesson Photo Local Status Online Upload Customer...Tlt · 视频 Discount Follow Search Deal Security Webinar Policy AI

/tag/Llama