(只要看到的,都能处理?)
作者 Simon Willison,他分享了自己在处理多个电子邮件 Email 中的数值数据时所采取的一种创新方法。
问题是这样的:需要对分散在十二封不同邮件中的一些数字值进行统计。但不想一个一个地手动复制和粘贴这些数据。
作者灵机一动,想到了一种新方法:通过录制屏幕捕获视频,然后使用Google Gemini从视频中提取数据。具体步骤如下:
1/ 录制视频:使用Mac上的QuickTime Player录制了屏幕视频,内容是他在Gmail中浏览这些电子邮件的过程。
2/ 上传视频:将录制的视频文件上传到Google的AI Studio工具。
3/ 数据提取:在AI Studio中输入提示,将视频内容转换为JSON数组,包含每个日期和相应的金额。
... 它成功了。它吐出了一个这样的JSON数组:
[
{
"date": "2023-01-01",
"amount": 2...
},
...
]
4/ 数据验证:将生成的JSON数据转换为CSV格式,并手动检查视频中的数值,确保数据的准确性。
花了多少钱?成本分析
作者对这次操作的成本进行了详细计算,发现使用Gemini 1.5 Flash模型处理视频的总成本不到1/10美分。实际上,由于Google AI Studio目前免费,这次操作实际上是免费的。
作者还探讨了其他可能的替代方案,包括:
1/ 手动复制数据:这种方法容易出错且耗时。
2/ 以编程方式访问Gmail数据:这种方法越来越困难,设置复杂。
3/ 使用浏览器自动化工具:需要更多的工作量,且无法处理邮件格式差异。
4/ 使用更复杂的AI工具:不够可靠且存在安全风险。
——
大模型真的能看清、理解这个世界。
通过录制视频的方式,任何数据都可以被处理,这会颠覆以往的应用吗?
欢迎加入AI编程社区,一起探索可能性。
本站资源均来自互联网,仅供研究学习,禁止违法使用和商用,产生法律纠纷本站概不负责!如果侵犯了您的权益请与我们联系!
转载请注明出处: 免费源码网-免费的源码资源网站 » 用大模型提取任意数据#视频录屏:从35秒的屏幕捕获中提取JSON数据,成本不到1/10美分...
发表评论 取消回复