近日,由@ammaar开发的创新项目Openjourney引发广泛关注。这款工具不仅在界面上巧妙模仿了MidJourney,更在技术核心上深度整合了GoogleGeminiSDK,并集成了强大的Imagen4和Veo2/3模型,为用户提供了一站式的AI图像和视频生成解决方案。Openjourney旨在让用户轻松利用AI生成高质量的图像和视频,同时享受与MidJourney相似的直观交互体验。
Openjourney充分利用Imagen4模型,能根据用户输入的文字描述生成四张1024×1024像素的高清图片。它的界面设计借鉴了MidJourney经典的四宫格布局,并加入了实时加载动画,大大提升了用户体验。生成的图片可以直接下载、放大查看,甚至能一键转换为视频。
在视频生成方面,Openjourney同样表现出色:通过Veo3模型,用户只需输入文字描述,即可生成一段带音频的3-5秒720p短视频;借助Veo2模型,静态图片也能“动起来”,用户选择一张图片并添加文字描述,即可将其转化为动画视频。视频内容以2×2网格形式展示,鼠标悬停即可自动播放,交互性极强。
Openjourney在用户体验方面也考量周全。其输入框简洁直观,用户输入提示词后点击“生成”或按下回车即可开始。平台支持全屏查看和下载作品,并通过箭头键方便用户翻阅生成历史,如同翻看相册一般。界面的流畅动画效果得益于FramerMotion,而加载时的“骨架屏”占位则进一步提升了专业感。
Openjourney的技术栈现代且robust,非常适合开发者学习和二次开发。它采用Next.js15(包含AppRouter和Turbopack)作为前端框架,确保了出色的性能和开发体验;使用TypeScript提升了代码可靠性;基于TailwindCSSv4快速构建美观界面;利用FramerMotion实现流畅的交互效果;并整合了ShadCN和RadixUI保证界面的美观性和无障碍标准。其核心AI能力正是通过GoogleGeminiSDK调用Imagen4和Veo2/3模型来实现图像和视频生成。
Openjourney的发布,无疑为开源社区带来了MidJourney的一个强大且充满潜力的替代方案,展示了GoogleAI技术在创意应用领域的广阔前景。
地址:https://github.com/ammaarreshi/openjourney