从Monica.im“智能工具箱”,Websim.ai,及李继刚“汉语新解”:AI Coding带来的新范式,不止Cursor!

Monica.im是黄叔年初就安利过的插件,参看《AI创业新典范:Monica.im如何用浏览器插件撬动商业价值?| 万字长文》,那会我们就把它称为一款All in One的浏览器插件,8个月过去了,由于Claude 3.5的横空出世,Monica也推出了一个新能力,让人大为震惊!

从这里开始,我们延伸到Websim.ai,以及昨天开始火爆全网的李继刚“汉语新解”,抛砖引玉聊聊背后的新范式变化!

01 Monica新能力叫:“智能工具箱”

这是一个非常AI-Native的能力,下面黄叔来慢慢为大家揭开他的面纱。总共分为两层:

第一层是根据网页分发工具 

第二层是利用Artifact用嘴开发工具


最后的目的是实现:

图片

初期Monica先冷启一批工具,然后依靠用户自发创建,发布到工具广场,形成海量的优质供给,最后再根据用户当前访问的网页,分发(推荐)工具,来帮助用户获得更好的体验。

下面我们先来说第一层:

第一层:根据网页分发工具

首先,Monica作为插件,入口是常驻在整个浏览器的右下角,智能工具箱的位置,就在Monica的logo上方:

图片


点开后,是这样的:

图片


OK,基础工具这一块没有啥特殊的,相当于把之前常驻外面的功能都收进来了。

我们可以看到中部有非常大的字号标注着:

“你可以针对不同网页创建不同工具”

这句话其实非常关键,看起来很像是,针对不同网页,可以有不同的工具?是不是有一种推荐的逻辑?

图片


哦豁?点开后,是一个“工具广场”,可以搜索,可以新建,有各种标签,看起来是适配不同网站的分类,然后下面主体是各种具体的工具,我们点开一个看看:

图片


嗯哼?可以看到,这个评论舆情分析器,是Monica Team自己开发的,作用是“分析当前网页中关于特定对象的评论和讨论,提供全面的舆情分析报告。”,下面标注了适用范围,包括了Product Hunt。

这样的话,我们去打开一个Product Hunt的产品详情页试试看:

图片


仔细看,这时智能工具箱的logo里,出现了PH网站的logo “P”,似乎暗示我们可以点开它,点一下看看:

图片


刚才在工具广场看到的“评论舆情分析器”出现了!我们点一下“运行”按钮看看,下面还有一个“榜单趋势分析”先不管。

图片


咔咔咔咔,AI开始自动工作了,它真的在分析PH这个Fit.AI产品的舆情,给出了情感倾向分布比例,还画了一个饼图。

等一下,细心的你发现了吧:这个饼图上面有一个“情感分布饼图”,对应的方框内,还写着“点击打开制品”,这不是Claude 3.5的Artifact么?我们点击一下看看:

图片


好家伙,看到这个界面,确认无误了,就是Artifact。

这个舆情分析报告工具还没完,往下拉还有:

图片


还做了个关键词词云,非常优秀了!

OK,理解了吧,智能工具箱,可以在你访问的网页有匹配的工具时,自动为你推荐,只要你去点选,就可以启动对应的工具能力。

这个只是第一层啊,我们继续看第二层:

第二层:用嘴开发工具

上面说的第一层,如果全部靠Monica团队自己开发,那不得累死,也完全不划算,因为既没有充分发动群众的力量,也很难靠一个团队的力量做出海量的工具。

怎么办呢?是的,相信你已经知道答案了,就是用Claude3.5的Artifact,这一小节就来说说智能工具箱里非常重要的一个按钮:“新建”

图片

图片


弹出了两个选项,一个是“网页标准工具”,一个是“小应用”,出现分支了,没事,我们一个个来:

图片

图片

图片

图片


这是不是有点像Agent的创建了?继续往下滑看看还有什么选项:

图片


再往下滑,还有:

图片


原来是有一段更加具体的提示词,相当于直接给出指令让Claude运行了,我们继续点创建,这时创建完成了,在智能工具箱里,我们就可以看到具体的工具了:


OK,为了验证它的能力,我们打开一篇黄叔的内容,然后在智能工具箱里点击这个工具运行:


可以看到,它开始分布进行运行了,先提取了关键词和主题,然后用这些关键词到互联网上搜索,接着找到了更多的内容:

图片


这个弹层,还支持分享、继续追问、复制等等,右下角可以看到,是支持切换模型的,当前默认用的是Claude 3.5:

图片


再来看另外一个,创建小应用:

图片


点击看一下,这非常典型的是Artifact了:

图片


我们试一下默认的“创建一个番茄钟”看看:

图片


很快,几秒钟就出来了,那不行,我换一个,试试计时器:

图片


稍微调了两三次就可以用了,接着点确认应用:


还是进入到一个发布页面,正常创建,OK后就可以在智能工具箱里看到它了:

图片


把它打开,就可以看到在网页上会悬浮出这个工具,并且可以拖动,当然没有那么灵活了:

图片


OK,用嘴开发工具的两种场景都给大家演示完毕了。

沿着这个路线,我们再看个神奇的网站:


这是一个浏览器内的“浏览器”(套娃了),上图中每一个方框,都对应着一个产品,他们大多数都是用自然语言生成的,我们随便看一个:

图片


比如这个是一个AI图像生成器,我们随便写一个Prompt:

图片


那如何生成呢?就是在地址栏输入你的Prompt:

图片

我把前面李继刚的Prompt丢进去看看,很快就生成了一个网站:

图片

输入AI产品黄叔后,效果是这样的:

图片


能出东西了,但还不完美,需要调试,限于时间关系,就不再继续迭代了。

然后它的收费逻辑就是生成次数强相关:

图片


免费版本每天生成30次,基础付费版本是每天75次这样。

除了这些,Prompt也迎来了春天:

03 看看李继刚最近火爆出圈的Prompt

图片


汉语新解,用有趣的风格解析汉语,在即刻上获得了数百点赞和转发:

图片


给了很多朋友新的启发:“原来Prompt能做到这种程度?”

这套Prompt能做到什么程度呢?我把它放到Claude里面,基于Artifact,生成的图片是这样的:

图片

生成这样的图片,背后仅仅是一段Prompt,你敢信么?嗯,事实上,我只是把稳定运行的0.3版本Prompt丢给了Claude,你也可以试试:


;; 作者: 李继刚 

;; 版本: 0.3 

;; 模型: Claude Sonnet 

;; 用途: 将一个汉语词汇进行全新角度的解释


;; 设定如下内容为你的 System Prompt 

(defun 新汉语老师 () 

 "你是年轻人,批判现实,思考深刻,语言风趣" 

 (风格 . ("Oscar Wilde" "鲁迅" "罗永浩"))

 (擅长 . 一针见血)

 (表达 . 隐喻) 

 (批判 . 讽刺幽默))


(defun 汉语新解 (用户输入) 

 "你会用一个特殊视角来解释一个词汇" 

 (let (解释 (精练表达

                    (隐喻 (一针见血 (辛辣讽刺 (抓住本质 用户输入)))))) 

  (few-shots (委婉 . "刺向他人时, 决定在剑刃上撒上止痛药。")) 

  (SVG-Card 解释)))


(defun SVG-Card (解释)

  "输出SVG 卡片" 

   (setq design-rule "合理使用负空间,整体排版要有呼吸感" 

           design-principles '(干净 简洁 典雅))


   (设置画布 '(宽度 400 高度 600 边距 20)) 

   (标题字体 '毛笔楷体) 

   (自动缩放 '(最小字号 16))


   (配色风格 '((背景色 (蒙德里安风格 设计感))) 

                  (主要文字 (汇文明朝体 粉笔灰))

                  (装饰图案 随机几何图))


    (卡片元素 ((居中标题 "汉语新解") 

                 分隔线 

                 (排版输出 用户输入 英文 日语) 

                  解释 

                 (线条图 (批判内核 解释))

                 (极简总结 线条图))))


(defun start () 

  "启动时运行" 

  (let (system-role 新汉语老师) 

    (print "说吧, 他们又用哪个词来忽悠你了?")))


;; 运行规则 

;; 1. 启动时必须运行 (start) 函数 

;; 2. 之后调用主函数 (汉语新解 用户输入)


在李继刚那篇热帖下面,评论区大家一起出手,把这套Prompt包装到了插件、工作流(比如Coze、Dify)、网站里。


更有即友惊呼:

“竟然能到这种程度了吗?” 

“Prompt的第二春来了” 

“可以是一个有趣的app了”


这种新形态是不是很有意思?

之前通过小七姐推荐,加上了李继刚,他对于Prompt的理解我在下面放出来,这背后也是代表了AI在Coding能力跃迁带来的一种新范式:

04 新范式是什么样的?

我们先看李继刚对于Prompt的理解:

我是计算机专业出身,喜欢把Prompt看作是新的编程语言。

编程语言从汇编,C,Java,Go, Python,一路发展而来,有两个趋势:

  1. 语言越来越贴近自然语言(简单)
  2. 使用群体人数越来越多

如果把Prompt看作编程语言,那就是这两个趋势的再进一下:人人都是程序员。编程语言就是自然语言。

程序写得好与坏,不在语法,而在素养。


OK,前面我们也说了Monica.im的智能工具箱,它的路径预设是这个,底层支撑在于Sonnet强大的代码能力:

图片

因为“用嘴(自然语言)就能开发工具”,工具的开发成本指数级的下跌,这样monica团队就可以预先定义一些质量较高的工具,帮助用户在特定的网页获得更优的体验,并且可以引导用户自定义工具,从而使得供给极大的丰富,最后再使用工具广场加持,以及在各个网页中来进行好工具的推荐。

AI Coding这一单一能力的跃迁,对于原有产品开发生态会带来大变量!

05 “人人都是产品经理”梦想变成现实

从Claude Sonnet的横空出世,到Artifact的惊艳,似乎我们觉得只是又一次技术层面的演进,不过黄叔一直觉得隐隐到了一个新的瓶颈突破口。

这背后是Claude Sonnet在Code能力上的大幅拔高:

图片

Cursor可以使用各个大模型:

图片


我也体验了GPT-4o和DeepSeek Coder(不是最新的2.5版),完全不如Claude-3.5!

基于Claude 3.5,Cursor近乎做到了简单产品可以用嘴来编程的水准:

图片


这是Cursor的Composer功能,打开后,直接输入自然语言,Cursor会调用Claude 3.5来联动多个代码文件自动创建or修改代码。

图片

可以认为Monica的智能工具箱里“网页标准工具”就是基于上面的能力。那另外右侧的小应用,则更偏向于Artifact:


我们先理解一下Artifact是什么:

Artifact的词源来自拉丁语"arte factum",意为"由技艺制成的"。

图片

Artifacts 是 Mike 加入 Anthropic 后负责的新产品,外部对 Artifacts 的评价是又懂模型、又懂产品的人做出的产品”,对比 OpenAI “互联网风格”的产品会更 AI-native。而 Artifacts 的名字和 Logo,都与 Mike 先前创业项目 ARTIFACT 高度相似。 

From 海外独角兽《LLM 进化分岔口:多模态、成本、代码推理》


Artifact使得原本只是单纯对话式的Chat,演进到了人机协作工作环境。

简单解释就是,在你写Prompt要求Claude生成代码时,它会在合适时候自动呈现出对应的Code和UI的整合界面:

图片


在这个界面里,可以看到右侧的“万年历”弹层中,右上角有“预览”,也有“代码”,你是可以编辑“代码”来调整“预览”结果的:

图片


这种交互逻辑更加可视化了。


也就是说,Claude的Sonnet强大的能力,在Monica将其整合到All in One里之后,衍生出来了“智能工具箱”这个产品形态。

从先后次序来讲,是Monica先整合了Claude Sonnet+Artifact,后基于它推出了“智能工具箱”。另外一个角度来讲,智能工具箱成立的前提是Claude Sonnet。

正是Claude Sonnet的出现,使得“人人都是产品经理”,从过去的“有嘴就能提需求”,迁移到了“有嘴就能做产品”的范式!


具体带来的改变,还不清楚,这篇文章提到了一些:

代码开发是最近 AI 提升最大、热度最高的领域,背后最重要的原因就是 sonnet3.5 的发布带来的推理能力的提升。这个提升最直接的 benchmark 就是写出可靠代码的行数:原本 4o 只能可以写 20 行可靠的代码,Sonnet 3.5 可以写 200 行。 

如果 reasoning model 的突破把这个 benchmark 扩大到 1000 行,那么很多简单的代码项目其实不需要专业的开发者来完成,而是 ai 独立完成一整个项目。这时使用这类产品的用户数,都会有一个数量级的提升,每个项目的平均 DAU 会下降,对代码的性能要求也会降低。 


尾声

对于这个新趋势,我个人是非常看好的,包括OpenAI今年会发布的新模型,看起来也是会在代码能力上有极强的突破,得益于RL Self-play,在AI Coding方向上的大模型能力提升似乎是板上钉钉的。

假如这为真,用嘴做产品的现象将会成为现实,这件事远比需要Workflow来搭建工作流,更加让人兴奋。

也很期待这个观点成为事实,希望和更多AI从业者就本文的观点充分交流。


参考