|
家喻户晓,如安在画面中输出文字一向是文生图大模子的弱項。不外近来阿里巴巴做的新模子AnyText给了這個困難一個解。
好比给出Prompt:“一张钢笔的電商告白,上邊写有“雙12大促!”,“出水流利”,“當即發貨”,“包去腳氣膏, 邮”,“立减50”。”很快就可以天生下面這张图片:
乃至不消點窜都能直接看成電商图片来利用了。
今朝,AnyText 支撑中英日韩四種说话。该項目在魔搭社區放出了 Demo ,可以經由過程摆設到當地利用,也能够直接在魔搭社區试用。
给出Prompt:“一壁蓝色的墙,用中英日韩四種说话写着“happy,快活,ジョイフル,즐거운””,以後 AnyText给出了這张图片:
看起来很多多少了,固然文字另有點怪。再换一個主题试一试,正好南邊小马铃薯這個梗正火,咱們随着小马铃薯去哈尔滨看看:
结果不错,乃至讓人感觉AnyText在文字输出能力這方面秒了當前最强的Midjourney。要晓得前不久方才更新的Midjourney 還只能输出简略的英文,并且结果也只能说一般。
能經由過程理解Prompt以後,给出得當的图案,同時辅以得當的文字,总体不说藝術性有多高,但适用性是拉满了。最少做脸色包又多了一個路子。
由AnyText天生
AnyText今朝供给两種功效,一個是图片天生,一個是图片编纂。顾名思义,图片生成绩是按照用户的描写来天生一张带有文字的图片,而图片编纂可讓AI帮忙用户扭轉现有的图片中的文字。
图片编纂是AnyText一個很是适用的功效,只要将想要點窜的图片上傳,并在想要點窜或添加文字的處所涂抹,同時写上提醒词便可以對图片中的文字举行點窜。既可以扭轉现有的文字内容,也能够零丁為图片增长文本。
上图為AnyText點窜後的结果,下图為原图
左图為原图,右图為點窜後的结果
图片编纂這個功效可以在很大水平上提高列位美工教員點窜图片的速率。不外有了AnyText以後,今後生怕大師還要更加谨慎来果断图片中内容的真假了。
而另外一個就是图片天生功效,這實際上是Aleo娛樂,nyText的重要功效,可以在必定水平上代替平面設計的事情。用户除必要供给提醒词以外,還可以對文字呈现的位置举行调解。AnyText在這方面供给了三個分歧的模式,别離是随機、手绘和拖框。
手绘模式可讓用户随機選擇文字呈现的位置,若是對付文字位置没有太好設法的用户,還可以操纵拖框功效拖出一個长方形文本框,讓AI在框内随機阐扬。
手绘
拖框
若是想不到符合的位置,也能够直接選随機,讓 AI 自行放置。
選好文字位置,咱們便可以输入提醒词,并调解图片的参数。讓咱們来看看更多 AnyText天生的图片结果吧:
在随機模式下提出请求:天生一张1980年的报纸,题目是“新报”
在手绘模式下输入:一個卵形的铭牌,写有“姓名:罗建成,ID:0875”
在手绘模式下输入:天生一個将来感的LOGO,標有“GENAI 新世界”
在拖框模式下输入:一幅古典人物画像,標有固体诗文“知否知否,應是绿肥红瘦”
随機模式下输入:画一個瓜果装潢的奶油蛋糕,下方写有“生日快活”
在拖框模式下输入:一张儿童蜡笔划,丛林中有一座糖果屋,题目是“糖果屋”
在手绘模式下输入:一名大妈站在通知布告板前,写有“平安出產”
各類图片證實,AnyText的文字表达能力和同業比起来挺强的,不論是中文仍是英文都能清楚地讓人識别出来,乃至連古体字也能轻松表示。
但這就讓人感受很是遗憾了,由于在它的文字输出能力眼前,AnyText的图片内容質量和理解能力都跟不上。這讓AnyText像一個偏科生,固然有一項表示出格超卓的科目,但总体成就平淡。這比那些哪哪都不可的模子更讓人感觉惋惜。
AnyText另有一個很大的問题,就是天生時候的問题。固然不少图片天生模子都必要必定的時候来天生内容,但没有像AnyText耗時這麼长的。根基上一组图片天止汗露,生必要耗時3—4分钟,乃至有的图片天生時候跨越了5分钟。而 AnyText 本身给出的预估時候常與现實耗费時候抵牾,讓用户感觉期待時候更久。并且AnyText是否是還會呈现Bug,讓用户必需從新天生图片。
另有一點,AnyText 固然可以扭轉图片的辨别率、强度、種子数、气概等專業参数,但這方面指导做的其實不好,若是不是随便點開,很多人几近都找不到扭轉参数的位置。天生式大模子都成长一年了,這些根本功效還必要人本身發掘,這點挺使人遗憾的。
整体来讲,AnyText其實不算一款成熟的產物,固然在文字输出方面有着本身的上風,但就今朝的图片質量而言,想要投入现實利用生怕仍是要好好练習一段時候。 |
|