什么是Midjourney,以及如何使用它来创建人工智能艺术?
了解Midjourney,并利用它创造人工智能艺术的方法是什么?
Midjourney是一种生成式人工智能(AI)平台,允许用户通过短文本提示生成独特的艺术作品,如角色、图像和描绘。
生成式AI平台是一种人工智能系统,通常能够生成新的和独特的内容,通常以图像、文本或其他创意输出形式呈现。与为特定任务设计的传统基于规则的AI系统不同,生成式AI平台使用基于深度学习技术的先进算法,自主地产生新颖且与上下文相关的输出。
Midjourney AI是一种创新的生成式AI平台,为创造性表达开辟了新的可能性,并能够产生超越显式编程的输出,为AI领域引入了不可预测性和创造力的元素。这可以应用于各种艺术领域,创造出现实世界中不存在的逼真图像。
本文讨论了Midjourney AI的定义、Midjourney工作原理、有效的提示、Midjourney与Dall-E 2的区别以及Midjourney艺术作品的好处。它还提出了一个长期困扰人们的问题:使用由AI生成的艺术是否道德?本文还提供了一个逐步指南,教艺术家如何使用Midjourney创建独特的AI生成艺术作品。
相关链接:AI的ABCD:自动化、大数据、计算机视觉和深度学习
什么是Midjourney AI?
Midjourney是Midjourney研究实验室开发的一款生成式AI程序和服务。Midjourney团队由Leap Motion的联合创始人David Holz领导。与OpenAI的DALL-E和Stability AI的Stable Diffusion一样,Midjourney使用称为提示的自然语言描述来创建视觉效果。
Midjourney的网站描述自己为“一个独立的研究实验室,探索思维的新的阻断网络,拓展人类物种的想象力。”
自2022年7月12日开放测试以来,用户可以使用在Discord机器人命令中使用简单的基于文本的提示使用Midjourney创建高质量的艺术作品。使用Midjourney不需要专用硬件或软件。但是,为了访问该服务,需要拥有Discord账号。
Midjourney如何工作?
Midjourney通过两种机器学习技术的复杂相互作用来运行:大语言模型和扩散模型。当用户输入提示时,大语言模型解析单词的含义并将其转化为数值向量。
这个向量在指导扩散过程中起着关键作用,其中Midjourney使用扩散模型将随机噪声转换为视觉上吸引人的艺术品。扩散模型通过逐渐向图像的训练数据集添加随机噪声来生成全新的图像。该模型通过学习随时间逆转这种噪声来生成完全不同的图像。
例如,如果用户输入了一个文本提示,如“以明亮的颜色和动画形式进行比特币挖矿”,Midjourney从一个视觉噪声场开始。通过潜在扩散,经过训练的AI模型逐步减去噪声,最终展现出原始提示中指定的对象和主题的本质的图像。
语言理解和扩散建模的协同作用使Midjourney能够根据用户的输入或提示创建引人入胜且多样的AI生成艺术品。
如何开始使用Midjourney — 一步一步的指南
Midjourney的beta版只能通过Discord账号访问。以下是使用Midjourney创建独特AI生成图像的一步一步教程:
步骤1:加入Midjourney Discord
已经有Discord账号的用户可以访问Midjourney.com,点击“加入Beta”按钮,或者直接访问Midjourney Discord。对于没有Discord账号的人,先注册一个免费的Discord账号,然后加入Midjourney Discord服务器。你可以在任何地方使用Midjourney Discord,包括网页版、移动版和桌面应用程序。
步骤2:选择订阅计划
2022年7月服务首次推出时,任何人都可以免费生成25张图像。然而,到了2023年4月,Midjourney暂停了免费试用计划。除了一些短暂的促销期,Midjourney不再免费提供。定价计划可以在下表中找到。
步骤3:使用“/imagine”命令生成艺术作品
首先,您可以进入Midjourney Discord服务器上的“#newbies”频道,后面跟着一个数字。有许多这样的频道,您可以选择任何一个。在新手频道中,输入“/”,后面跟着“imagine”,然后是Midjourney生成所需图像的提示。
例如,/imagine prompt:“比特币以明亮的颜色和动画外观开采。”
另一个/imagine提示的例子,“以现代科技环境为背景的以太坊区块链元素”,给出了以下结果:
Midjourney生成图像需要多长时间?
平均而言,Midjourney大约需要一分钟生成四个艺术作品选项。然而,这并不固定,如果需要生成一个放大的图像或非方形长宽比的输出,时间可能会增加。
Midjourney的订阅计划有快速模式和放松模式,根据订阅的计划,生成速度会发生变化。在快速模式中,不需要排队等待。然而,即使是最昂贵的付费计划在快速模式下生成的图像数量也有月度限制。
在放松模式中,图像请求会被发送到队列中。生成可能需要1到10分钟才能完成。此外,Midjourney还提供了昂贵的“Turbo”模式,可以通过“/turbo”命令激活。Turbo模式可以以四倍的速度生成新图像,但会消耗订阅计划的每月配额时间的两倍。
我要如何保存Midjourney生成的图像,由谁拥有这些图像?
要保存在Midjourney生成的图像,点击图像以完整尺寸打开,然后右键点击选择“保存图像”选项。在移动设备上,长按图像,然后点击右上角的下载图标。
Midjourney允许用户查看所有先前创建的图像,包括用于生成它们的提示。要在Discord上访问先前创建的Midjourney图像,请转到Discord收件箱的“提及”选项卡并下载以前的图像。
Midjourney图像属于公共领域,所有权是开源的。Midjourney自述本身是一个开放的社区,允许他人在公共场合发布时使用和混合图像和提示。默认情况下,Midjourney上的所有图像都是公开可见和可混合的。因此,任何人都可以访问和修改它们。这使得销售Midjourney艺术品是值得怀疑的。
Midjourney和Dall-E 2之间有什么区别?
Dall-E 2是一个文本到图像模型,是Dall-E的后续版本,由OpenAI研究实验室建立,该实验室还推出了ChatGPT。在2019年,OpenAI从微软和Khosla Ventures获得了超过10亿美元的资金,而在2023年1月,随着Dall-E 2和ChatGPT的推出,它又获得了微软的额外100亿美元的资金。Midjourney是自我资助的,由一个独立实验室Midjourney Inc建立。
尽管Dall-E 2和Midjourney都是基于生成图像的自然语言描述,但使用取决于具体要求和偏好。一些区别如下:
- 访问方式:Midjourney可以通过Discord访问,而Dall-E 2只能通过OpenAI的网站访问。
- 图像分辨率:Midjourney可以生成1792×1024的图像,而Dall-E 2生成1024×1024的分辨率。
- 订阅:两者都有订阅计划,用户可以查看各自网站上的更新费率,以确定哪个更适合他们。
Midjourney的优势和利用
Midjourney使艺术家能够探索各种艺术风格、主题和概念,培养创造力,并推动传统艺术形式的界限。艺术家可以尝试多个参数和技术,产生从抽象组合到逼真表现的多样化输出。由于快速的人工智能反馈生成图像所带来的省时特性。
此外,与Discord等平台的整合增强了Midjourney的协作特性,允许艺术家在志同道合的人群中共享想法、技术和创作。
除了艺术表达,Midjourney还有利于创建产品图片、插图、社交媒体创意、营销宣传材料、非同质化代币(NFT)艺术项目、建筑可视化等领域。
人工智能艺术是否合法和道德?
虽然人工智能艺术在法律上是合法的,但其道德影响是多方面的,涉及与创造力、所有权、偏见和社会影响相关的考虑。人们普遍认为,尽管人工智能工具对创造作出了贡献,但输入和指导来自人类。明确的归属和所有权准则对于解决这些问题至关重要。
使用人工智能生成的艺术作品进行商业用途引发了公平报酬和剽窃的问题。艺术家应意识到销售人工智能生成作品的道德问题以及它如何与艺术界的既定规范相一致。
人工智能模型是基于可能携带有其中存在的偏见(性别、种族或文化偏见)的数据集进行训练的。这可能无意中导致有偏见的输出,加强现有的刻板印象或偏见。艺术家和开发者需要意识到这些偏见并努力减轻它们。
培训和运行像Midjourney和Dall-E 2这样的先进人工智能模型所需的计算资源引发了对大规模人工智能操作的碳足迹的环境担忧。伦理讨论应该考虑与大规模人工智能运营相关联的碳足迹。
We will continue to update 算娘; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles