(只要看到的,都能处理?)

作者 Simon Willison,他分享了自己在处理多个电子邮件 Email 中的数值数据时所采取的一种创新方法。

问题是这样的:需要对分散在十二封不同邮件中的一些数字值进行统计。但不想一个一个地手动复制和粘贴这些数据。

作者灵机一动,想到了一种新方法:通过录制屏幕捕获视频,然后使用Google Gemini从视频中提取数据。具体步骤如下:

1/ 录制视频:使用Mac上的QuickTime Player录制了屏幕视频,内容是他在Gmail中浏览这些电子邮件的过程。

2/ 上传视频:将录制的视频文件上传到Google的AI Studio工具。

3/ 数据提取:在AI Studio中输入提示,将视频内容转换为JSON数组,包含每个日期和相应的金额。

f13dd60c27655bdc378460e848cc9509.jpeg

... 它成功了。它吐出了一个这样的JSON数组:

[
 {
   "date": "2023-01-01",
   "amount": 2...
 },
 ...
]

4/ 数据验证:将生成的JSON数据转换为CSV格式,并手动检查视频中的数值,确保数据的准确性。

 
花了多少钱?成本分析

作者对这次操作的成本进行了详细计算,发现使用Gemini 1.5 Flash模型处理视频的总成本不到1/10美分。实际上,由于Google AI Studio目前免费,这次操作实际上是免费的。

作者还探讨了其他可能的替代方案,包括:

1/ 手动复制数据:这种方法容易出错且耗时。

2/ 以编程方式访问Gmail数据:这种方法越来越困难,设置复杂。

3/ 使用浏览器自动化工具:需要更多的工作量,且无法处理邮件格式差异。

4/ 使用更复杂的AI工具:不够可靠且存在安全风险。

——

大模型真的能看清、理解这个世界。

通过录制视频的方式,任何数据都可以被处理,这会颠覆以往的应用吗?

欢迎加入AI编程社区,一起探索可能性。

8105888ee7478399218758a6ab5b6157.jpeg

奖金池1500元:MiX AI编程挑战赛第一季,满足长尾需求的自制软件“便利店”

d35d2b802b2ed316156aeb59f7bc0449.png

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部