35 条回复  ·  3837 次点击
mrergouwang666 楼主 初学 2025-10-9 03:12:10
@msg7086 是的,说的太好了
twig 小成 2025-10-9 05:48:30
这个功能是有用的。因为泛泛地说,任何一个功能都是有用的,只是你需要找到觉得它有用的人…… 感觉作为一个独立的网页,对于用户实际应用的场景是很远的。 什么场合需要描述图片内容呢? - 用户拍了照上传 Instagram ,想写一句话炫耀 - 创作者写完博客,上传图片,为了 accessibility 想加一个 alt 注释 - 报纸或者杂志的网站的编辑写完稿子之后,发表之前需要在每幅配图下面配一句话(你猜猜中国杂志界把这个东西叫什么?) 所以现在的问题是: - 你能打通 Instagram 的 iOS app 吗?感觉很难。你能做一个浏览器插件,适配常见的社交网络吗?比如,用户打开「发推」的界面,上传完图片,就自动帮他总结图片。 - 你能写个 PHP 的东西,做成 WordPress 插件吗?这个确实是很多人会花钱买的。因为 WordPress 用户都是不会写代码的。 - 同样的道理,你能打通报纸、杂志网站的 CMS 吗?给他们编辑新闻的界面加一个按钮,点一下就掉用你的服务总结一下。然而你看你都不知道中国杂志界把这个东西叫什么,整合进去也不容易吧。 还有就是你的 UI 啊……无力吐槽啊……
twig 小成 2025-10-9 06:02:12
生成描述之后有一个 复制,有一个下载 JSON 。 你面向的用户是谁啊?普通用户的话,你让普通用户下载 JSON 干啥?码农的话,我用你这玩意儿干啥? 你给我生成出来的是啥文本格式啊? ``` Here are a few options for a catchy caption, choose the one that best fits your desired tone! Option 1 (Sweet & Simple): Sweet and serene, radiating youthful charm in her classic sailor uniform. Pure school day vibes! 🌸 Option 2 (Reflective): A gentle smile and a moment of calm reflection. There's a timeless beauty in youthful innocence and a crisp school uniform. ✨ Option 3 (Engaging): Fresh faces and classic uniforms never go out of style! Loving this sweet schoolgirl aesthetic. 😊 Appropriate Hashtags: #SchoolGirl #SailorUniform #Seifuku #YouthfulVibes #SweetSmile #StudentLife #AsianBeauty #Portrait #Innocence #FreshFace #UniformStyle #SchoolDays #CuteGirl #GentleLook ``` 能不能搞搞 prompt engineering ,让 LLM 直接生成结构化的数据,你自己先 parse 好,最后把干干净净的字给用户。最后给用户一句话、几个 hashtag ,用户点一下「复制」就能利利索索的复制走,直接贴到 Instagram 里? 像这样: https://i.imgur.com/DjSgTdP.png
soo2 初学 2025-10-9 06:47:18
我艹,这正是我需要的需求!我有很多张 meme 图。一直想将其归类,根据内容重命名,这样日后使用的时候就很容易找到。手动弄了几百张就搞不下去了,只有用 AI 搞了。
KuroNekoFan 小成 2025-10-9 06:59:09
还挺好玩的,除了选了中文输出结果输出了英语
piku 小成 2025-10-9 07:24:51
没看懂,好像是给视障人士使用的“描述图片”?
slackerman 初学 2025-10-9 07:42:51
11 楼说的没错,有点用,但是离用户太远,可能要集成到某类相关 APP 中才容易被用到
moefishtang 小成 2025-10-9 08:22:32
你的网页被卡巴斯基拦截了... (今天 Imgur 怎么上传不了图片...报 400 号错误
LongLights 初学 2025-10-9 08:30:48
这个需求的确是有的: 1. 网站主给图片加 alt 标签 2. 发布平台生成文案(这里和 alt 标签的描述风格应有差异) 3. 视障人士读屏 但是我能想到的以上及类似需求需要更高的集成度,比如做成 php 网站的插件之类的
opengps 初学 2025-10-9 08:51:08
花了大精力去证明了这个事属于“伪需求”,本身也是收获的过程
返回顶部