登录
/
注册
门户
资讯
论坛
网站赚不到钱?立刻加入参与变现
字体超市--好字体用得起,买得起!
共建未成年人"Z站长网"网络空间承诺书
Z站长网
站长工具
站长文章采集
提供网站文章自动采集
Alexa排名查询
根据 Alexa 排名统计数据估算网站 IP、PV 值.
百度权重查询
根据关键词指数与排名估算网站的百度流量
SEO综合查询
查询网站在各大搜索引擎上的SEO数据
友情链接查询
查询网站的友情链接数据及识别对方是否骗链
Whois信息查询
查询域名的详细whois信息及验证域名是否过期
网站备案查询
查询网站的ICP备案、网安备案及备案历史记录
ico图标制作
提供专业ico图标制作
站长素材
字体下载
分享PS字体、免费字体、商业字体库
简历模板
提供各类个人简历模板下载,包括中英文简历.
高清图片
提供高清图片下载,包括背景图片、欧美图片等
矢量素材
打造高精矢量素材下载,包括矢量花纹、图标等
PPT模板下载
提供各类PPT模板下载,包括企业、商务等模板
PSD素材
提供海量PSD素材
源码下载
源码上传
精品源码
源码平台
汇集各类源码
正版软件
各行业主流软件、功能完善
插件/模版
discuz\织梦\thinkphp等精品模版插件
源码下载
各种源码/软件/模版/插件免费下载
网站排名
行业排行榜
提供休息娱乐、购物、服务等行业网站的排名
地区排行榜
提供全国34个省级行政区域的网站排名
移动网站排行榜
提供中文网站排名
公司排行榜
根据各行业各地区公司市值、注册资金等排名情况。
关注我们
Z站长网-新浪微博
有时卖萌,有时天然呆,节操与【小站】同在
Z站长网-微信公众号
请微信搜公众号Z站长网,添加关注我们
Z站长网
Z站长网-百家号
专注报道互联网、创业和前沿资讯.
[登录/注册]
免费搭建"企业官网"私域
播放器收一切自然量
广告招租QQ:258638587
广告招租QQ:258638587
10000来路IP只需8元
专业SEO按天计费源码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
SEO收录查询
编程
电脑基础
Z站长网
Portal
Ai
BBS
资讯
专题
发布帖子
搜索
搜索
本版
文章
帖子
用户
道具
勋章
任务
设置
我的收藏
退出
返回列表
楊羊羊
5 天前
·
问答
关注
微软研究院推出POML语言:让AI助手像利用模板一样明白复杂指令 ...
[ 复制链接 ]
来自
版块
:
问答
703
0
假如你曾经试着和ChatGPT如许的AI助手沟通,大概会发现一个风趣征象:同样的题目,用差别方式表达,AI的答复质量大概天差地别。就像和一个外国朋侪交换,你语言的方式、用词的次序,乃至标点符号的位置,都大概影响对方的明白水平。
这篇由微软研究院的张雨格、陈楠、许嘉航、杨雨晴等研究职员共同完成的论文,发表于2025年4月的arXiv平台上(论文编号:arXiv:2508.13948v1 [cs.HC]),就专门研究了这个令人头疼的题目。有爱好深入相识的读者可以通过https://arxiv.org/abs/2508.13948访问完备论文。
研究团队发现,如今的AI对话就像是在没有同一格式的环境下填写复杂表格。有时间你必要让AI处置惩罚一个Excel表格的数据,有时间必要它阅读PDF文档,有时间还要它同时看图片和笔墨。但题目是,每次你都得手动把这些质料"喂"给AI,而且轻微改变一下表达方式,AI的明白就大概出现毛病。
为了办理这个题目,微软研究团队开辟了一套名为POML(Prompt Orchestration Markup Language,提示编排标志语言)的全新体系。简朴来说,这就像是为和AI对话制作了一套尺度化的"填空模板"。就比如你去银行服务时填写的尺度表格,每个信息都有固定的位置和格式,不会由于你的字写得美丽照旧丢脸而影响银行工作职员的明白。
POML的焦点头脑就是把和AI的对话酿成一种布局化的"配方"。当你想让AI分析一份市场陈诉时,不消再费心思索该怎么形貌这个使命,而是直接利用预设的模板:告诉AI它如今的"脚色"是数据分析师,"使命"是分析市场趋势,然后把PDF文档、Excel表格等质料按照尺度格式"装"进去就行。
这套体系最奇妙的地方在于,它把内容和样式完全分开了。打个比方,这就像Word文档的样式功能:你写好文章内容后,可以随时切换差别的格式样式,让同一篇文章看起来像正式陈诉、商务信件大概学术论文。POML也是云云,同样的对话内容可以根据差别AI模子的"喜欢"调解格式,确保每个AI都能最好地明白你的意图。
研究团队不但开辟了这套语言体系,还为步伐员们制作了配套的开辟工具。就像如今的代码编辑器会主动提示语法错误、补全代码一样,POML也有本身的智能编辑情况,能及时预览结果、查抄错误,乃至直接测试AI的相应效果。
为了验证POML的实用性,研究团队举行了两个风趣的实行。第一个实行开辟了一个名为PomLink的iPhone应用原型,这个应用能让用户轻松地把各种文件(文档、图片、表格等)"喂给"AI,然后举行对话。令人惊奇的是,利用POML开辟如许一个复杂应用竟然只用了两天时间,而且大部门时间照旧花在界面计划上,真正的AI对话逻辑编写非常简朴。
第二个实行更是展现了一个令人震动的发现:同样的题目,仅仅是改变一下格式和表达方式,差别AI模子的正确率差别竟然能到达惊人的水平。好比GPT-3.5-Turbo在某种格式下的正确率只有6%,但换个格式就能到达61.8%,提拔了整整9倍多。这就比如同一道数学题,用差别方式提问,有的门生完全不会做,有的却能轻松解答。
通过对8个差别AI模子举行10万次测试,研究团队发现每个AI都有本身独特的"明白偏好"。有些AI喜好看到数据用CSV格式出现,有些则偏幸HTML表格,另有些对JSON格式情有独钟。POML体系可以或许主动辨认这些偏好,为每个AI"量身定制"最得当的对话格式。
更风趣的是,研究团队还约请了7位差别配景的志愿者来测试POML的易用性。这些志愿者包罗软件工程师、研究职员和门生,他们对AI应用开辟的履历各不雷同。测试效果表现,纵然是没有相干履历的新手,也能在很短时间内学会利用POML创建复杂的AI对话场景。
志愿者们对POML最赞赏的功能是它处置惩罚各种文件格式的本领。一位测试者表现:"从前想让AI读取PDF文档或Excel表格简直是噩梦,如今就像插入一张图片一样简朴。"另一位测试者则对及时预览功能赞不绝口:"我可以立即看到AI会收到什么样的信息,不消反复试错了。"
固然,POML也不是完善无缺的。一些志愿者反映,对于非常简朴的对话,利用POML大概有点"大材小用"的感觉,就像用专业相机拍个朋侪圈照片一样。别的,体系在处置惩罚超大文档时偶然会出现性能题目,必要等候较长时间。
从技能角度来看,POML接纳了雷同网页开辟的三层布局:内容层负责界说对话的逻辑布局,样式层控制格式出现,工具层提供开辟支持。这种计划让整个体系既机动又稳固,步伐员可以像搭积木一样组合差别功能,而不消担心牵一发而动满身。
研究团队在论文中坦承,POML现在还处于起步阶段,有许多可以改进的地方。好比对残障人士的无停滞支持还不敷美满,必要更好的屏幕阅读器兼容性。同时,他们也认可测试规模相对有限,必要更多真实场景下的验证。
但这项研究的意义远不止于技能自己。随着AI助手在昨们生存中饰演越来越紧张的脚色,怎样更好地与它们交换成为了一个急迫必要办理的题目。POML提供了一种尺度化的办理方案,让平凡人也能像专家一样与AI举行高效对话。
预测将来,研究团队筹划将POML开源,让更多开辟者可以或许利用和改进这套体系。他们还假想POML可以或许应用到更广泛的范畴,好比教诲工具、企业应用,乃至成为AI体系之间相互交换的通用语言。
说到底,POML就是在AI期间为人类提供了一套更好的"语言方式"。就像昨们学会了利用搜刮引擎的本领一样,把握了与AI高效沟通的方法,昨们就能更好地使用这些强盛的工具来办理现实题目。这项研究为昨们打开了一扇新的大门,让昨们看到了人机交换的新大概。
Q&A
Q1:POML是什么?它能办理什么题目?
A:POML是微软研究院开辟的一套尺度化AI对话语言,就像给AI制作了同一的"填空模板"。它重要办理如今与AI对话时格式杂乱、结果不稳固的题目,让用户能更高效地与AI交换,特殊是处置惩罚复杂使命时。
Q2:利用POML必要编程底子吗?
A:不必要很强的编程底子。研究团队的测试表现,纵然是没有AI开辟履历的新手也能快速上手。POML接纳了雷同HTML的简朴标志语言,配有智能编辑器提供及时资助和错误查抄。
Q3:POML对差别AI模子的结果真的差异很大吗?
A:是的,研究发现同一个题目用差别格式表达,AI的正确率差别可以到达9倍以上。每个AI都有本身的"明白偏好",POML能主动适配这些偏好,确保每个AI都能发挥最佳性能。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
综合
最新
热度
发表评论
全部评论 0
期待你的评论哦~
楊羊羊
此人什么也没留下~
关注
文章
203
积分
631
都听说要收购玛莎拉蒂了,奇瑞策划20年还没上市?
阅读 1475
宜家宜商“双星”闪灼!睿蓝7财产版上新、睿蓝8环球表态 ...
阅读 1414
比亚迪涨2.32%,成交额52.68亿元,人气排名29位!后市是否有时机?附走势预 ...
阅读 1392
热文
3 天
7天
1
互联网大厂重回春晚
2872热度
2
重庆:到2025年底建成逾2000座超充站
2846热度
3
千亿元巨头 业绩新高!洛阳钼业最新年度业绩再度刷新历史纪录 ..
2812热度
4
中欧班列(西安)新年开门红
2754热度
5
不再掉队?阿森纳英超强势8连胜,去年同期4胜2平2负
2747热度
6
以优良文风提升宣传质量和水平
2734热度
7
摩根大通分析师警告称美股出现互联网泡沫式的市场集中 前10大股
2703热度
8
1月游戏版号发放再破百,机构:或推动产业繁荣发展,中概互联ETF
2692热度
9
抖音做不好互联网医疗?
2655热度
10
无人不网 未成年人网络保护面临新风险
2629热度
1
吴清再度提及量化交易监管 如何理解最新提出的“趋利避害、突出
2619热度
2
大厂员工再无巨额年终奖
2608热度
3
再提“派兵” 马克龙敦促盟友力挺乌克兰
2543热度
4
国网数科控股公司荣获工信部工业互联网平台贯标认证 ...
2524热度
5
被AI淘汰的专业,出现了
2524热度
6
售33.98万元起 新款腾势D9正式上市
2514热度
7
威马成“危马”:创始人行踪成谜 车主困在“售后中” ...
2514热度
8
AI进讲堂、AI数字底盘……一文感受数字新生活
2500热度
9
售23.58万起 新款冒险家及混动版上市
2453热度
10
互联网平台提现限制重重,是合理规定还是霸王条款? ...
2433热度
查看更多
发布新话题
所属版块
返回版块
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
立即登录
发送
本版积分规则
回帖后跳转到最后一页
说说你的想法......
0
0
0
返回顶部