55
66你也可以为这个项目出一份力,如果发现有价值的信息、文章、工具等可以到 [ Issues] ( https://github.com/SwiftOldDriver/iOS-Weekly/issues ) 里提给我们,我们会尽快处理。记得写上推荐的理由哦。有建议和意见也欢迎到 [ Issues] ( https://github.com/SwiftOldDriver/iOS-Weekly/issues ) 提出。
77
8- ## 新闻
9-
10- > 行业相关的新闻、趣事、看法
11-
12- ## Developer - 设计开发加速器
13-
14- > 设计开发加速器相关活动
15-
16- ## 新手推荐
17-
18- > 收集一些对新手友好且质量不错的文章
19-
208## 文章
219
22- > 写的不错的技术博客,包含但不局限于 iOS、多端统一、设计、产品等
23-
2410### 🐎 [ Why I'm Not Using Xcode 26's AI Chat Integration (And What Could Change My Mind)] ( https://www.fline.dev/why-im-not-using-xcode-26s-ai-chat-integration-and-what-could-change-my-mind/ )
2511
2612[ @阿权] ( https://github.com/bqlin ) :文章者结合自身开发体验,分析了 Xcode 26 中 AI 集成的不足,并建议 Apple 补齐(作者也是恨铁不成钢啊!):
5642| 注意力机制 | MHA(多头注意力) | GQA(分组查询注意力) | 减少显存与计算开销 |
5743| 长上下文优化 | 无 | 滑动窗口注意力(128 token) | 进一步降低长文本推理成本 |
5844| 归一化层 | LayerNorm | RMSNorm | 简化计算,提升 GPU 训练效率 |
59- | 推理控制 | 无 | 推理强度可调(低/中/ 高) | 平衡成本与准确率 |
45+ | 推理控制 | 无 | 推理强度可调(低 / 中 / 高) | 平衡成本与准确率 |
6046
6147gpt-oss 与 Qwen3 模型差异较小,在一些特性上各有千秋:
6248
@@ -68,7 +54,7 @@ gpt-oss 与 Qwen3 模型差异较小,在一些特性上各有千秋:
6854实用价值与局限:
6955
7056- 优势:MXFP4 优化适配单 GPU(20B 需 16GB 显存,120B 需 80GB 显存),推理强度可调,性能接近闭源模型;
71- - 局限:幻觉率较高,无训练代码/ 数据集(仅开源权重与推理代码),未提供基础模型;
57+ - 局限:幻觉率较高,无训练代码 / 数据集(仅开源权重与推理代码),未提供基础模型;
7258- 未来潜力:随着工具集成成熟,可通过调用外部资源(如搜索引擎)弥补知识遗忘,进一步释放推理能力。
7359
7460总体而言,gpt-oss 的发布丰富了开源 LLM 生态,为需要本地部署、高推理能力的场景提供了新选择,也为研究 Transformer 架构演进提供了重要参考。
@@ -91,23 +77,8 @@ SwiftUI 引入了 `ConcentricRectangle` 这个新的 API,帮助开发者更
9177
9278### 🐕 [ MNN LLM Chat iOS 流式输出优化实践] ( https://mp.weixin.qq.com/s/m5J5nLZiPd_yB0y-byyjCg )
9379
94- [ @JonyFang ] ( https://github.com/JonyFang ) : 本文针对 iOS 应用中部署大语言模型(LLM)时出现的文字流式输出卡顿问题,提出了一套高效的三层优化方案:通过智能流缓冲解决模型输出与 UI 更新的频率不匹配,利用UI更新批处理与节流降低主线程压力,并借助打字机动画渲染增强视觉流畅性。这一方案提升了本地 LLM 应用的交互体验,适合开发高性能 AI 聊天应用的团队参考实践。其开源实现:[ MNN GitHub项目 - https://github.com/alibaba/MNN ] ( https://github.com/alibaba/MNN ) 。
95-
96- ## 工具
97-
98- > 开发过程中常用的工具,及一些新工具的介绍
99-
100- ## 代码
101-
102- > 库,代码段,开源app
103-
104- ## 书
105-
106- > 比较不错的书的推荐和书评
107-
108- ## 音视频
80+ [ @JonyFang ] ( https://github.com/JonyFang ) : 本文针对 iOS 应用中部署大语言模型(LLM)时出现的文字流式输出卡顿问题,提出了一套高效的三层优化方案:通过智能流缓冲解决模型输出与 UI 更新的频率不匹配,利用 UI 更新批处理与节流降低主线程压力,并借助打字机动画渲染增强视觉流畅性。这一方案提升了本地 LLM 应用的交互体验,适合开发高性能 AI 聊天应用的团队参考实践。其开源实现:[ MNN GitHub 项目 - https://github.com/alibaba/MNN ] ( https://github.com/alibaba/MNN ) 。
10981
110- > 比较不错的书的推荐和书评
11182
11283## 内推
11384
0 commit comments