slot deposit pulsa slot mahjong slot gacor slot gacor slot gacor resmi slot gacor 2025 slot gacor terpercaya slot gacor 2025 slot gacor hari ini slot gacor hari ini slot gacor hari ini
传统图片站或将被 AI 合成图像技术取代
17611538698
webmaster@21cto.com

传统图片站或将被 AI 合成图像技术取代

人工智能 0 1469 2022-12-05 11:04:03

图片

导读:AI生成的合成照片也许很快替代Shutterstock和Getty等传统图片站。不算标题党,它是有原因的,请看内容。


目录


在本篇文章中将分享如下内容:


  • 人工智能生成的摄影图库技术已经成熟,可以取代Shutterstock等图片站

  • 轻松提取 PDF和图像的问答内容,可以节省数百万美元

让我们现在开始。

AI 提取内容

直接从PDF中提取内容、分类和问题答案,现在可以使用AI 在几秒钟内完成。


在此之前,数以百万计的实习生、公司员工和高管在全球各大公司——他们的首要职责是从PDF中提取并汇总信息。


这个行业,更准确地说是数据分析和提取,是一个千亿美元的市场。


AI 具有极高的自动化程度,未来的公司已经在实施先进的提取工具,来完成比竞争对手多几个数量级的工作。


图片

DocQuery 就是一个典型的产品和例子。

DocQuery 是一种 AI 工具,可以在几秒钟内读取 PDF 并自动提取数据,包括关键文本、问题,甚至是调查中的数据。

它通过自然语言界面运行,使用起来直观,而且是免费的:该模型托管在HuggingFace上,你可以根据需要下载和扩展它。

图片

我们如何利用这一点?像这样的AI模型被很多人忽视了,因为人们普遍缺乏如何将它们集成到业务工作流程中的理解。


但它的应用范围是未可限量的。比如,大型企业可以使用 DocQuery 来做以下事情:


  • 从财务 PDF 中自动生成关键点摘要:指标、关键点、数字等。

  • 按类型(例如发票、合同、法律文件等)对文档进行分类,以便轻松转发到正确的部门。

  • 通过提取关键文本和图形,然后将它们重新排列到新模板中,灵活地重新格式化 PDF。

  • 从客户调查中提取数据,以便生成可操作的决策。


即使经验丰富的专业人员也需要一个小时或更长时间才能完成这些任务中的其中一项。但通过向 AI 管道添加灵活的数据提取,人们可以在几秒钟内就可以拿到相同的结果。

例如,我们在1SecondCopy实现了一个(非常)简单的合同管理系统,每周可以节省 60-90 分钟。

我们有时一天会收到三四份合同,它们通常是 NDA、工作协议等文档。然而,解析法律术语需要相当多的时间。

但是对于DocQuery,我只需要问一个问题,比如“支付多少钱?” 或“付款条件是什么?”然后,在几秒钟内得到答复。

AI生成的摄影图库很快将取代 Shutterstock等图片库

PixelVibe是一个全新的AI生成的图库摄影平台。而它的用户体验颠覆了Shutterstock、Getty 和其他传统图库类媒体。

图片

无需策划特定的搜索词,或花费数小时从一个平台跳到另一个平台。

你现在只需点击一张图片,它就会拉出数百个相似的图片供人们来选择。最后,你将注意力集中在想要的图片上即可,可无需输入搜索词组。

这只是 AI 图像工具可能性范围的又一步。随着现在许多方面与真正的 DSLR 摄影无异的稳定质量传播,股票证券媒体行业很快就会被AI深刻影响。

我们如何利用这个优点?


不到48 小时前,Pixel Vibe就在 Product Hunt 上被隆重推荐。这表明这个产品的用户体验肯定比传统的图片网站好得多。


这个空间非常适合创业的公司发芽并推进新的竞争。图片媒体公司已经被OpenAI的DALL-E2(AI图片修改)和StableDiffusion(文本转图片)而损失惨重。


一个能够生成图像,然后又能提供智能搜索,这种下一代图像平台可以很容易地将这种损失转化为成功的商业模式。


那么,如果在实践中我们该怎样做?


  • 使用或训练类似于Lexica 的 Aperture的模型。这里提示一些细节,如果你选择训练自身,并对 DSLR 照片进行微调。

  • 采集 Shutterstock 或 Getty 用来创建关键字列表。100K 关键字或更多是最佳的。

  • 现在已经有了一个关键字列表,再生成一组风格短语列表:镜头类型、光圈和其他摄影术语。想想Sigma 30mm f1.4、微距、散景等短语。

  • 通过使用不同风格的短语遍历每个关键字,生成一百万或更多图像。例如,如果一个关键字是smiling woman on street,那么一代人可能是smiling woman on street,sigma 30mm f1.4。另一个可能是smiling women on street。

  • 将图像、文字嵌入等存储在某个地方,比如AWS或者其它云存储平台。也可以跳过文本/图像嵌入步骤,并通过另一个模型运行生成图像,该模型为每个图像生成标题或标签(以加快搜索速度)。

  • 你现在拥有一个包含更多图像的后端。然后继续需要做,改善前端的客户用户体验:通过更快地产生结果、创建更好的图片设计等。

  • 最后,选择 Netflix 商业模式路线收取人人负担得起的月度订阅费用。在普通人触手可及的最先进的图像生成器的未来,传统图片售卖模型将不再可行。


在我和大家分享时候,也许有人开始行动了。而第一个利用这一优势的人将看到巨大的利基效应。

作者:大雄

参考:

https://twitter.com/sharifshameem/status/1593393961980162048

评论