摘要: 本文介绍了LateNiteSoft公司在AI图像编辑领域的测试和研究。该公司拥有15年iOS摄影应用开发经验,并基于此开发了MorphAI应用。文章详细介绍了他们如何使用OpenAI、Gemini和Seedream等AI模型进行图像编辑测试,并分析了不同模型在不同编辑类型上的表现。测试结果表明,OpenAI在风格转换和创意生成方面表现优异,而Gemini在保持真实感方面更胜一筹,Seedream则介于两者之间。文章还讨论了如何根据不同的编辑需求选择合适的AI模型,并提出了一个“提示分类器”的概念。
讨论: 用户对OpenAI、NanoBanana和SeeDream等图像生成模型进行了讨论。主要观点包括:OpenAI在人脸处理上改动过大,细节平滑;NanoBanana在图像质量上表现最佳,但缺乏高保真选项;SeeDream正在追赶NanoBanana,有时效果更好;GPT模型在细节一致性上存在问题;Gemini模型有时拒绝应用任何编辑;OpenAI的图像生成中存在“尿渍滤镜”问题尚未修复;用户对在日本进行的高速度互联网连接测试表示惊讶;OpenAI的结果可以通过黄色色调识别出来;用户建议在模型切换时也应包括原始图像。
原文标题:We ran over 600 image generations to compare AI image models
原文链接:https://latenitesoft.com/blog/evaluating-frontier-ai-image-generation-models/
讨论链接:https://news.ycombinator.com/item?id=45890186