沃垠AI : Kimi K2-Thinking这样用,才是真爽|附我的一手实测

本文转自: https://mp.weixin.qq.com/s?__biz=MzIwMTU5OTQ1Nw==&mid=2653722752&idx=1&sn=1a095e0427b7b5f24744626704f9f7ab
仅做个人收藏,版权归原作者所有

原创 冷逸 2025-11-09 10:20 四川

?k=2b0bb362&u=https%3A%2F%2Fmmbiz.qpic.c

快榨干了我的脑花

这个动画,由K2 Thinking一键直出⬆️

搜索、总结、推理&编程,一气呵成。

这便是Kimi最近开源的模型:K2 Thinking。可以「边思考,边使用工具」,按官方的说法,最多可实现300步的工具调用。

我的实测体验是,K2 Thinking是一个六边形战士。用好它的搜索、深度研究、推理和编程组合技,能够拔高模型的上限。

现在,上Kimi.com,在工具箱勾选“联网”&“长思考”,当出现灯泡提示时,就代表已经可以使用K2 Thinking模型了。

?k=61d3d041&u=https%3A%2F%2Fmmbiz.qpic.c

如果是在Claude Code里接API,模型全名叫「kimi-k2-thinking」,记得按一下键盘上的Tab键,打开Thinking模式。

?k=fa6d992b&u=https%3A%2F%2Fmmbiz.qpic.c

API调用指引:

https://platform.moonshot.cn

?k=d2b71a2a&u=https%3A%2F%2Fmmbiz.qpic.c

拆解开篇案例

开篇的这个case,来自大聪明的Prompt,我略微改了改,就生成了中国出生入口数据走势图的svg动画。

可以直接在kimi里预览,也可以把代码复制进公众号,一键直出。

?k=84215ae1&u=https%3A%2F%2Fmmbiz.qpic.c

完整prompt是:

请你分步骤,逐年搜索:中国2010年-2024年的出生人口数据。
找到所有信息后,创建一个HTML页面,页面加载后JavaScript自动生成一个完整的、自包含的SVG可视化图表。SVG需要使用width="100%"来自动适应容器宽度,height 不做设定,留出少部分上下边距,SVG应自带合适的深色背景,与品牌颜色相称,12px 圆角,没有阴影。
JavaScript的工作流程:在页面加载时(或在script标签中立即执行),根据你搜索到的真实数据,计算每个数据点的坐标位置,然后通过DOM操作(如createElement、createElementNS、appendChild等)动态构建完整的SVG元素,包括:背景、坐标轴、刻度线、网格线、数据点圆圈、真实数值标注、两条折线路径,以及SVG原生的动画元素(animate、animateTransform等)。所有内容生成后插入到页面中id为"Chart"的SVG元素内。注意:纵坐标从0开始,以稍微超过最高值为顶点。
SVG图表中需要包含图表标题、数据来源标注等必要信息,这些文字应该优雅地放置在图表顶部或底部。同时需要包含完整的坐标轴系统,包括横轴显示时间刻度(标注年份),纵轴显示刻度(标注具体数值和单位),以及适当的网格线以提高可读性。
图表中必须在每年的数据点位置使用圆点标记,并标注该年的具体真实数值(从前面的搜索数据中获取)。这些数值标注应该合理布局,避免重叠。
这个SVG图表需要包含两条折线,两条线都必须精确穿过每年的数据点:
第一条是完整的曲线,连接所有年份的数据点,它应该一直显示在画面中作为底层;
第二条是高亮折线,使用与内容相符的品牌色,它完全覆盖在第一条曲线之前,使用完全相同的路径数据,但颜色更亮、明显发光,明显的更粗,通过SVG的stroke-dasharray和stroke-dashoffset的animate元素来实现逐段依次展示,每次间隔0.3秒(完整播放完,需要约3秒)。高亮折线都展示完毕后,保持0.5秒,然后重新开始改循环。
整个页面应该极简设计,不要有任何body样式、button样式或其他CSS装饰。除了SVG图表本身和一个复制按钮之外,不要有其他HTML元素。复制按钮应该放置在页面最底部,使用以下代码实现复制功能:
javascript
async functioncopySVG() {
  const svgElement = document.getElementById('Chart');
  const svgData = new XMLSerializer().serializeToString(svgElement);
  try {
    const clipboardItem = new ClipboardItem({
'image/svg+xml': new Blob([svgData], { type'image/svg+xml' }),
'text/html': new Blob([svgData], { type'text/html' })
    });
    await navigator.clipboard.write([clipboardItem]);
    alert('SVG已成功复制到剪贴板!');
  } catch (err) {
    console.error('复制失败:', err);
    alert('复制失败');
  }
}
关键要求总结:页面加载时JavaScript自动生成包含真实数据和SVG原生动画的完整SVG,生成后这个SVG是完全自包含的。复制功能只需简单序列化这个已生成的SVG元素。复制出去的SVG可以独立使用,包含真实的数据标注和循环播放的动画效果,无需任何外部JavaScript支持。

理论上,只要改改搜索主题,就可以生成各种统计图。

比如,股价图。

?k=0b1f5029&u=https%3A%2F%2Fmmbiz.qpic.c

销售图。

?k=9110c9d9&u=https%3A%2F%2Fmmbiz.qpic.c

K2-Thinking,把搜索、推理、编程这些功能都一一串联起来了。

它让模型变得越来越实用,而并非反复测天气卡片、物理小球以及数草莓(strawberry)那么无聊。

这是因为,K2-Thinking是一个「会思考、会使用工具」的Thinking Agent,全程无需人类干预,原生支持300多步的工具调用。

怎么理解呢?

我们来看一下前面比亚迪汽车销售图的thinking过程,你就明白了。

?k=acf934e7&u=https%3A%2F%2Fmmbiz.qpic.c

(可上下滑动,查看全图)

整个thinking过程,Kimi做了这几件事:

  • 理清用户需求,像写PRD一样先梳理用户的需求清单;

  • 联网搜索,逐月找出比亚迪汽车的销售数据;

  • 发现有数据缺失,自己调用搜索工具补全数据;

  • 补全数据后,自己再验证一轮数据;

  • 有了数据后,写HTML页面。

整个过程,像极了我们人在做事情。只不过,K2只需要几分钟;而我们人需要多部门、多岗位联动,最快也要一天左右才能完成。

所以,我觉得K2-Thinking是一个很能解决实际场景的模型

?k=54b71409&u=https%3A%2F%2Fmmbiz.qpic.c

更多实测

1)大模型能力象限图

搜索GPT、Claude、Gemini、GLM、Kimi、DeepSeek、Qwen、MiniMax、Doubao、ERNIE等模型在2025年的最新发布信息;
推理出各家的技术战略差异与下一步方向;
然后创建一个象限图的html,用来展示这些厂商在「模型能力」「开放程度」「商业化情况」「创新性」四个维度的分布。

不知道大家评价如何,但Kimi已经把自己排了开源第一,hhh

?k=b9fc9d31&u=https%3A%2F%2Fmmbiz.qpic.c

来看下它的信源。

?k=83583de2&u=https%3A%2F%2Fmmbiz.qpic.c

这网络浏览能力(BrowseComp)是极其靠谱的,连刚刚发布的ERNIE 5.0都收录进来了。

2)2026流行口味预测

你是“AI 味觉研究员”,要预测 2026 年最流行的全球美食口味。
请联网搜索 2025 年美食趋势。
推理:
哪些口味(甜、辣、发酵、植物基、功能性食品)正在崛起?
它们流行的社会心理因素是什么(健康、文化、节庆、短视频传播)?
编写 html 页面:
使用 词云 + 气泡图 展示趋势关键词热度(来源频率 × 搜索指数)
颜色代表口味类型,大小代表讨论热度
输出你的预测报告(150字以内):
“我预测2026年最流行的口味是____,因为____。”

先来看页面,它总结了今年的几大流行口味:发酵/酸味、辣味、植物基、亚洲风味、天然甜味、怀旧疗愈。

?k=cf41b462&u=https%3A%2F%2Fmmbiz.qpic.c

最热门的是「发酵酸味」,比如酸面包、醋、康普茶、益生菌等;飙升最快的是「亚洲风味」,比如柚子、酸角、班兰、抹茶等。

Kimi预测2026年的流行口味是「复合发酵酸」,因为它是健康功能、文化探索与情感体验的完美三角。

给出的理由是:

发酵食品市场以7.8%年增长率迈向1564亿美元。这种口味兼具短视频友好的视觉传播性、亚洲风味的文化深度,以及”益生菌+低糖”双重功能标签,完美平衡了Z世代的探险欲与养生焦虑,形成不可替代的”酸爽疗愈”体验。

届时,我们拭目以待。

3)科技公司墓志铭

联网搜索过去十年(2015–2025)已关闭或被收购的知名科技公司(至少5家)。
请推理它们失败的共同原因,以及哪些理念在当下AI浪潮中被“复活”。
输出一个可视化时间轴网页:
横轴:时间(2015–2025)
节点:公司Logo(或公司名)
点击后显示简介与“复活的理念”
动画滚动展示时间前进
背景色渐变暗示时代变化。

Kimi一共找出了7家公司,分别是:Vine、Google Glass、Quibi、Juicero、Theranos、Stadia和WeWork。

大家可以看看,有没有对自己创业有启发的公司。

?k=2d79554a&u=https%3A%2F%2Fmmbiz.qpic.c

完整会话内容:

https://www.kimi.com/share/19a62c4a-3982-84c2-8000-0000d9b14c2c

关于K2-Thinking模型多能力的综合运用,我设计了一个通用Prompt,大家有需要,直接在里面填内容就可以了。

你是一名【虚拟身份】。
请联网搜索【真实世界数据或事件】,提取【关键维度A/B/C】。
然后推理【这些信息之间的隐含逻辑或趋势】。
最终输出一个完整的 HTML 可视化网页:
结构包含标题、主图、交互区域和结论。
使用SVG或Canvas进行可视化展示。
动画或交互元素体现推理结果(如路线变化、趋势放大、节点闪烁)。

4)大模型向量化科普

我想用 Three.js 制作一个完整的可交互 3D 可视化网页,模拟“大语言模型向量空间中的词语查询”。
页面需求如下,请你直接输出完整、可运行的 HTML + JavaScript 代码:
核心功能:
展示一个 3D 坐标空间背景(类似星空或网格地面)。
每个词语对应一个球体节点,节点上方有标签(中文字)。
右侧有一个固定的控制面板,围绕“月球”一词列出一组可点击的词语按钮。
当点击某个词语按钮时:
中央显示该词对应的球体(例如红色)。
自动高亮并连线到若干余弦相似度最高的词语(例如 5 个)。
显示相似度(例如 “余弦相似度:0.89”)在悬浮提示框中。
支持拖拽旋转、滚轮缩放相机视角。
显示坐标轴(X/Y/Z)和地面网格。
动态更新:当点击不同的词语时,中间的球体和连线重新计算显示。
数据部分:
请内置一个简化的向量表(用 JSON 数组模拟),每个词语对应一个 3 维向量,如:
const vectors = {
'attention': [0.9, 0.2, 0.5],
'model': [0.7, 0.3, 0.4],
'knowledge': [0.2, 0.8, 0.5],
...
};
用 JavaScript 函数计算两个向量的余弦相似度。
视觉要求:
背景使用深色主题,星空或粒子背景。
标签悬浮在球体上方。
球体颜色按类别区分(中心词红色,相似词橙色,其他灰色)。
附加功能(可选):
在左下角显示当前选中词语与最高相似度词语的坐标与相似度。
自动平滑飞行到目标词语中心(Three.js Camera tween)。
请输出完整 HTML 文件,使用最新 Three.js CDN 链接,不依赖外部服务。

这个Prompt by 弘文(经授权发布),出来的效果超级赞。拿来做各种AI科普教学,非常直观。

5)3D太阳系模型

测试中,我还发现K2-Thinking特别擅长JavaScript语言,可以构建各种创意3D模型。

比如,这个简单的Prompt:

用Three.js构建可交互3D太阳系,需实现行星自转、公转、轨道倾角等功能。

生成的太阳系模型,非常逼真,且遵循物理规则。

?k=c894563d&u=https%3A%2F%2Fmmbiz.qpic.c

三体星系,也能制作。

根据《三体》小说的背景,用Three.js构建一个3D的三体星系(有3颗太阳,质量、颜色一致),模拟三体系统的混沌特性,需实现自转、公转、轨道倾角等功能。

?k=932aecae&u=https%3A%2F%2Fmmbiz.qpic.c

现在是混纪元了,三日凌空,快脱水!快脱水!!

6)能解难倒陶哲轩的数学题

这是MathOverflow(专业数学问答社区)上的一道数学难题:

序列lcm(1,2,…,n)是否是高度丰数的一个子集?

这道题超难,以至于陶哲轩想要证明这个问题,都要借助AI写29行的Python脚本来进行验证。

?k=944c1635&u=https%3A%2F%2Fmmbiz.qpic.c

大意是说,如果没有AI帮忙,我不会进行这次任务尝试。

我直接把这个问题丢给K2-Thinking,它的答案是「不是」。

?k=c7e4c34f&u=https%3A%2F%2Fmmbiz.qpic.c

经陶哲轩的亲自验证,这道题的答案确实是「不是」,我们来看下Kimi的详细回答。

?k=7fa09925&u=https%3A%2F%2Fmmbiz.qpic.c

(可上下滑动,查看全图)

解题过程也正确,跟陶神的论证过程基本一致。

就是这COT思维链,是真的长。我大概等了10分钟,才收到答案。

?k=4dc03bd2&u=https%3A%2F%2Fmmbiz.qpic.c

这么长的思维链,K2-Thinking居然没有产生幻觉,真的太神奇了。

?k=616247c5&u=https%3A%2F%2Fmmbiz.qpic.c

写在最后

个人实测下来,K2-Thinking有点像是一个“六边形战士”。

它不止步于推理,联网搜索、复杂信息搜索推理(可以理解为深度研究)、工具调用以及编程都很擅长,这一套组合技可以把它的上限拉得很高。

虽然也还有一些缺陷,比如复杂问题推理时间偏长、对提示词要求高、抽象/深层次语义理解偏浅等。

但是开源模型能够做到这样,我的心里只有两个字:敬佩。

最近这半年,Kimi的节奏挺快的。7月开源K2,9月开源K2-0905版强化coding能力,10月推出「OK Computer」Agent,11月继续开源K2-Thinking。

如果说前几代K2还在追赶,那么K2-Thinking已经开始“对齐”甚至局部超越GPT-5、Claude 4.5这些顶尖的闭源模型。

这种速度与质量,某种意义上代表了中国开源力量的新高度。

阅读原文

跳转微信打开

发表回复