沃垠AI ： Kimi K2-Thinking这样用，才是真爽｜附我的一手实测

本文转自： https://mp.weixin.qq.com/s?__biz=MzIwMTU5OTQ1Nw==&mid=2653722752&idx=1&sn=1a095e0427b7b5f24744626704f9f7ab
仅做个人收藏，版权归原作者所有

原创冷逸 2025-11-09 10:20 四川

快榨干了我的脑花

这个动画，由K2 Thinking一键直出⬆️

搜索、总结、推理&编程，一气呵成。

这便是Kimi最近开源的模型：K2 Thinking。可以「边思考，边使用工具」，按官方的说法，最多可实现300步的工具调用。

我的实测体验是，K2 Thinking是一个六边形战士。用好它的搜索、深度研究、推理和编程组合技，能够拔高模型的上限。

现在，上Kimi.com，在工具箱勾选“联网”&“长思考”，当出现灯泡提示时，就代表已经可以使用K2 Thinking模型了。

如果是在Claude Code里接API，模型全名叫「kimi-k2-thinking」，记得按一下键盘上的Tab键，打开Thinking模式。

API调用指引：

https://platform.moonshot.cn

拆解开篇案例

开篇的这个case，来自大聪明的Prompt，我略微改了改，就生成了中国出生入口数据走势图的svg动画。

可以直接在kimi里预览，也可以把代码复制进公众号，一键直出。

完整prompt是：

请你分步骤，逐年搜索：中国2010年-2024年的出生人口数据。
找到所有信息后，创建一个HTML页面，页面加载后JavaScript自动生成一个完整的、自包含的SVG可视化图表。SVG需要使用width="100%"来自动适应容器宽度，height 不做设定，留出少部分上下边距，SVG应自带合适的深色背景，与品牌颜色相称，12px 圆角，没有阴影。
JavaScript的工作流程：在页面加载时（或在script标签中立即执行），根据你搜索到的真实数据，计算每个数据点的坐标位置，然后通过DOM操作（如createElement、createElementNS、appendChild等）动态构建完整的SVG元素，包括：背景、坐标轴、刻度线、网格线、数据点圆圈、真实数值标注、两条折线路径，以及SVG原生的动画元素（animate、animateTransform等）。所有内容生成后插入到页面中id为"Chart"的SVG元素内。注意：纵坐标从0开始，以稍微超过最高值为顶点。
SVG图表中需要包含图表标题、数据来源标注等必要信息，这些文字应该优雅地放置在图表顶部或底部。同时需要包含完整的坐标轴系统，包括横轴显示时间刻度（标注年份），纵轴显示刻度（标注具体数值和单位），以及适当的网格线以提高可读性。
图表中必须在每年的数据点位置使用圆点标记，并标注该年的具体真实数值（从前面的搜索数据中获取）。这些数值标注应该合理布局，避免重叠。
这个SVG图表需要包含两条折线，两条线都必须精确穿过每年的数据点：
第一条是完整的曲线，连接所有年份的数据点，它应该一直显示在画面中作为底层；
第二条是高亮折线，使用与内容相符的品牌色，它完全覆盖在第一条曲线之前，使用完全相同的路径数据，但颜色更亮、明显发光，明显的更粗，通过SVG的stroke-dasharray和stroke-dashoffset的animate元素来实现逐段依次展示，每次间隔0.3秒（完整播放完，需要约3秒）。高亮折线都展示完毕后，保持0.5秒，然后重新开始改循环。
整个页面应该极简设计，不要有任何body样式、button样式或其他CSS装饰。除了SVG图表本身和一个复制按钮之外，不要有其他HTML元素。复制按钮应该放置在页面最底部，使用以下代码实现复制功能：
javascript
async functioncopySVG() {
  const svgElement = document.getElementById('Chart');
  const svgData = new XMLSerializer().serializeToString(svgElement);
  try {
    const clipboardItem = new ClipboardItem({
'image/svg+xml': new Blob([svgData], { type: 'image/svg+xml' }),
'text/html': new Blob([svgData], { type: 'text/html' })
    });
    await navigator.clipboard.write([clipboardItem]);
    alert('SVG已成功复制到剪贴板！');
  } catch (err) {
    console.error('复制失败:', err);
    alert('复制失败');
  }
}
关键要求总结：页面加载时JavaScript自动生成包含真实数据和SVG原生动画的完整SVG，生成后这个SVG是完全自包含的。复制功能只需简单序列化这个已生成的SVG元素。复制出去的SVG可以独立使用，包含真实的数据标注和循环播放的动画效果，无需任何外部JavaScript支持。

理论上，只要改改搜索主题，就可以生成各种统计图。

比如，股价图。

销售图。

K2-Thinking，把搜索、推理、编程这些功能都一一串联起来了。

它让模型变得越来越实用，而并非反复测天气卡片、物理小球以及数草莓（strawberry）那么无聊。

这是因为，K2-Thinking是一个「会思考、会使用工具」的Thinking Agent，全程无需人类干预，原生支持300多步的工具调用。

怎么理解呢？

我们来看一下前面比亚迪汽车销售图的thinking过程，你就明白了。

?k=acf934e7&u=https%3A%2F%2Fmmbiz.qpic.c

（可上下滑动，查看全图）

整个thinking过程，Kimi做了这几件事：

理清用户需求，像写PRD一样先梳理用户的需求清单；
联网搜索，逐月找出比亚迪汽车的销售数据；
发现有数据缺失，自己调用搜索工具补全数据；
补全数据后，自己再验证一轮数据；
有了数据后，写HTML页面。

整个过程，像极了我们人在做事情。只不过，K2只需要几分钟；而我们人需要多部门、多岗位联动，最快也要一天左右才能完成。

所以，我觉得K2-Thinking是一个很能解决实际场景的模型。

更多实测

1）大模型能力象限图

搜索GPT、Claude、Gemini、GLM、Kimi、DeepSeek、Qwen、MiniMax、Doubao、ERNIE等模型在2025年的最新发布信息；
推理出各家的技术战略差异与下一步方向；
然后创建一个象限图的html，用来展示这些厂商在「模型能力」「开放程度」「商业化情况」「创新性」四个维度的分布。

不知道大家评价如何，但Kimi已经把自己排了开源第一，hhh

来看下它的信源。

这网络浏览能力（BrowseComp）是极其靠谱的，连刚刚发布的ERNIE 5.0都收录进来了。

2）2026流行口味预测

你是“AI 味觉研究员”，要预测 2026 年最流行的全球美食口味。
请联网搜索 2025 年美食趋势。
推理：
哪些口味（甜、辣、发酵、植物基、功能性食品）正在崛起？
它们流行的社会心理因素是什么（健康、文化、节庆、短视频传播）？
编写 html 页面：
使用 词云 + 气泡图 展示趋势关键词热度（来源频率 × 搜索指数）
颜色代表口味类型，大小代表讨论热度
输出你的预测报告（150字以内）：
“我预测2026年最流行的口味是____，因为____。”

先来看页面，它总结了今年的几大流行口味：发酵/酸味、辣味、植物基、亚洲风味、天然甜味、怀旧疗愈。

最热门的是「发酵酸味」，比如酸面包、醋、康普茶、益生菌等；飙升最快的是「亚洲风味」，比如柚子、酸角、班兰、抹茶等。

Kimi预测2026年的流行口味是「复合发酵酸」，因为它是健康功能、文化探索与情感体验的完美三角。

给出的理由是：

发酵食品市场以7.8%年增长率迈向1564亿美元。这种口味兼具短视频友好的视觉传播性、亚洲风味的文化深度，以及”益生菌+低糖”双重功能标签，完美平衡了Z世代的探险欲与养生焦虑，形成不可替代的”酸爽疗愈”体验。

届时，我们拭目以待。

3）科技公司墓志铭

联网搜索过去十年（2015–2025）已关闭或被收购的知名科技公司（至少5家）。
请推理它们失败的共同原因，以及哪些理念在当下AI浪潮中被“复活”。
输出一个可视化时间轴网页：
横轴：时间（2015–2025）
节点：公司Logo（或公司名）
点击后显示简介与“复活的理念”
动画滚动展示时间前进
背景色渐变暗示时代变化。

Kimi一共找出了7家公司，分别是：Vine、Google Glass、Quibi、Juicero、Theranos、Stadia和WeWork。

大家可以看看，有没有对自己创业有启发的公司。

完整会话内容：

https://www.kimi.com/share/19a62c4a-3982-84c2-8000-0000d9b14c2c

关于K2-Thinking模型多能力的综合运用，我设计了一个通用Prompt，大家有需要，直接在里面填内容就可以了。

你是一名【虚拟身份】。
请联网搜索【真实世界数据或事件】，提取【关键维度A/B/C】。
然后推理【这些信息之间的隐含逻辑或趋势】。
最终输出一个完整的 HTML 可视化网页：
结构包含标题、主图、交互区域和结论。
使用SVG或Canvas进行可视化展示。
动画或交互元素体现推理结果（如路线变化、趋势放大、节点闪烁）。

4）大模型向量化科普

我想用 Three.js 制作一个完整的可交互 3D 可视化网页，模拟“大语言模型向量空间中的词语查询”。
页面需求如下，请你直接输出完整、可运行的 HTML + JavaScript 代码：
核心功能：
展示一个 3D 坐标空间背景（类似星空或网格地面）。
每个词语对应一个球体节点，节点上方有标签（中文字）。
右侧有一个固定的控制面板，围绕“月球”一词列出一组可点击的词语按钮。
当点击某个词语按钮时：
中央显示该词对应的球体（例如红色）。
自动高亮并连线到若干余弦相似度最高的词语（例如 5 个）。
显示相似度（例如 “余弦相似度：0.89”）在悬浮提示框中。
支持拖拽旋转、滚轮缩放相机视角。
显示坐标轴（X/Y/Z）和地面网格。
动态更新：当点击不同的词语时，中间的球体和连线重新计算显示。
数据部分：
请内置一个简化的向量表（用 JSON 数组模拟），每个词语对应一个 3 维向量，如：
const vectors = {
'attention': [0.9, 0.2, 0.5],
'model': [0.7, 0.3, 0.4],
'knowledge': [0.2, 0.8, 0.5],
...
};
用 JavaScript 函数计算两个向量的余弦相似度。
视觉要求：
背景使用深色主题，星空或粒子背景。
标签悬浮在球体上方。
球体颜色按类别区分（中心词红色，相似词橙色，其他灰色）。
附加功能（可选）：
在左下角显示当前选中词语与最高相似度词语的坐标与相似度。
自动平滑飞行到目标词语中心（Three.js Camera tween）。
请输出完整 HTML 文件，使用最新 Three.js CDN 链接，不依赖外部服务。

这个Prompt by 弘文（经授权发布），出来的效果超级赞。拿来做各种AI科普教学，非常直观。

5）3D太阳系模型

测试中，我还发现K2-Thinking特别擅长JavaScript语言，可以构建各种创意3D模型。

比如，这个简单的Prompt：

用Three.js构建可交互3D太阳系，需实现行星自转、公转、轨道倾角等功能。

生成的太阳系模型，非常逼真，且遵循物理规则。

三体星系，也能制作。

根据《三体》小说的背景，用Three.js构建一个3D的三体星系（有3颗太阳，质量、颜色一致），模拟三体系统的混沌特性，需实现自转、公转、轨道倾角等功能。

现在是混纪元了，三日凌空，快脱水！快脱水！！

6）能解难倒陶哲轩的数学题

这是MathOverflow（专业数学问答社区）上的一道数学难题：

序列lcm(1,2,…,n)是否是高度丰数的一个子集？

这道题超难，以至于陶哲轩想要证明这个问题，都要借助AI写29行的Python脚本来进行验证。

大意是说，如果没有AI帮忙，我不会进行这次任务尝试。

我直接把这个问题丢给K2-Thinking，它的答案是「不是」。

经陶哲轩的亲自验证，这道题的答案确实是「不是」，我们来看下Kimi的详细回答。

?k=7fa09925&u=https%3A%2F%2Fmmbiz.qpic.c

（可上下滑动，查看全图）

解题过程也正确，跟陶神的论证过程基本一致。

就是这COT思维链，是真的长。我大概等了10分钟，才收到答案。

这么长的思维链，K2-Thinking居然没有产生幻觉，真的太神奇了。

写在最后

个人实测下来，K2-Thinking有点像是一个“六边形战士”。

它不止步于推理，联网搜索、复杂信息搜索推理（可以理解为深度研究）、工具调用以及编程都很擅长，这一套组合技可以把它的上限拉得很高。

虽然也还有一些缺陷，比如复杂问题推理时间偏长、对提示词要求高、抽象/深层次语义理解偏浅等。

但是开源模型能够做到这样，我的心里只有两个字：敬佩。

最近这半年，Kimi的节奏挺快的。7月开源K2，9月开源K2-0905版强化coding能力，10月推出「OK Computer」Agent，11月继续开源K2-Thinking。

如果说前几代K2还在追赶，那么K2-Thinking已经开始“对齐”甚至局部超越GPT-5、Claude 4.5这些顶尖的闭源模型。

这种速度与质量，某种意义上代表了中国开源力量的新高度。

阅读原文

跳转微信打开

Related Posts

EV 的日本生活记录 ： 迪士尼日本分析 オリエンタルランド 4661

Joe Star ： 日本旅游记录

iFanr | 爱范儿-产品 ： 豆包深度思考模型正式发布！和 o3 一样能「看图思考」，还有一个 Agent 大招

第一次成功的网上购物的经历

EV 的日本生活记录：迪士尼日本分析オリエンタルランド 4661

Joe Star ：日本旅游记录

iFanr | 爱范儿-产品：豆包深度思考模型正式发布！和 o3 一样能「看图思考」，还有一个 Agent 大招