繁體簡體

中鐵房地產集團設計咨詢公司進行簡說分享探究建筑AI繪圖

華夏經緯網 > 新聞 > 大陸新聞 > 社會綜合      2023-05-30 17:26:45

近幾年來以GPT為首的AI技術大爆發(fā),對一系列行業(yè)造成了巨大的沖擊。在建筑設計行業(yè),也開始有設計師嘗試利用人工智能工具進行創(chuàng)作。5月23日,中鐵房地產集團設計咨詢公司創(chuàng)作二室鄭有池在第198期“簡·說”分享會上,向公司員工分享了近期熱度暴漲的人工智能繪畫軟件的發(fā)展情況,并介紹了利用AI繪畫工具進行輔助設計工作的一些方法。

與GPT之類更側重于邏輯分析能力的大語言模型不同,AI繪畫屬于人工智能生成內容領域,其更擅長對于形式和風格的模仿,可以依據(jù)簡單的提示和限制,快速生成大量具有表現(xiàn)力的方案圖像。在建筑設計的過程中,這種能力可以幫助建筑師在建筑設計前期工作尤其是概念設計階段擴展設計思路,也可以幫助提高與合作方之間的溝通效率。

目前市場上主要的AI繪圖產品很多,其中最有代表性的是Midjourney和Stable Diffusion兩款應用。

使用Midjourney需要通過Discord聊天平臺或QQ頻道進行付費訂閱,該款軟件主要特點是操作簡單,生成圖像品質較高,可以根據(jù)文本提示或參考圖片每次隨機生成4張全新的圖像。Midjourney的產品設計針對設計思考過程進行了優(yōu)化,例如Variation功能可以根據(jù)指定圖像進行聯(lián)想擴展,并結合提示詞重新生成4張不同的圖像;Blend功能可以融合兩張參考圖的元素生成新圖像,Seed功能可以記錄圖像風格基因,便于復制使用。這些功能在大部分美術創(chuàng)作工作中都能提供良好的使用體驗,生成富有啟發(fā)性的內容。而在建筑設計過程中,建筑師往往需要對形體和內容進行更精確的控制,Midjourney在這方面的功能目前還相對較弱。

Stable Diffusion是由StabilityAI公司推出的開源模型,可以通過其官網付費訂閱,也可以在本地部署使用。需要注意的是AI算法需要進行大量并行計算,在本地部署時需要顯卡支持CUDA算法,顯存至少達到4G,才能保證較好的出圖質量。由于Stable Diffusion的開源屬性,網絡中聚集了大量的二次開發(fā)者和內容分享者,他們創(chuàng)作了大量的功能擴展插件和微調模型,為精確控制AI進行繪圖提供了可能。

以使用Stable Diffusion進行文生圖功能為例,用戶先要選擇合適的主模型作為工作基礎。主模型是負責控制文本、編碼、圖片的映射關系的核心組成部分,用戶可以通過DreamBooth的方式對官方發(fā)布的主模型進行微調,強化其在特定領域生成圖像的能力。

確定合適的主模型后用戶需要將正面和負面提示詞分別填入對應的輸入框。然后選擇采樣方法和相應的迭代步數(shù)。默認的歐拉采樣器最佳迭代步數(shù)在20~50之間,一般情況下迭代步數(shù)越高,生成圖像的質量越高,對顯卡的計算能力要求也越高。在主界面設置圖像的高度和寬度時可以先將其設置在512像素之內,再通過Tiled Diffusion 和Tiled Vae插件提高最終生成圖片的分辨率,以提高顯卡工作效率,獲得更高質量的圖像。

完成設置后,點擊生成按鍵,程序即可開始隨機生成圖像。以上過程與Midjourney的生成過程類似。對于建筑設計輔助工作來說,可能會有更進一步的需求,例如對某種特定建筑風格的強化或對建筑形體進行精確控制,這些需求可以通過附加網絡模型和Controlnet等插件功能來滿足。

1.png

AI生成圖像效果 1

附加網絡模型是另一種微調模型,能夠在不改變主模型的前提下,強化AI對特定風格或形象的模仿能力。目前使用最廣的是Lora模型,其工作原理可簡單理解為在主模型計算過程的每次迭代間隙插入計算,以實現(xiàn)對結果的引導。與微調大模型的方式相比,Lora模型具有諸多優(yōu)勢,其體量更小,一般在70~150MB之間;而且訓練相對便捷,用戶可以根據(jù)需求訓練自己的lora模型;并且多個lora模型還可以疊加使用,各模型可以分別設置權重參數(shù),調整各自對生成過程的影響能力。

ControlNet插件可以對模型實現(xiàn)比較精準的控制,其集成了多種控制算法,包括線稿控制、深度信息控制、法線信息控制、seg語義分割控制、人體姿勢控制、shuffle色調控制、reference參考圖控制等。使用時先導入作為控制條件的圖像,根據(jù)需要選擇相應的預處理器和模型,并設置控制條件對生成圖像影響的權重參數(shù)即可。

2.png

AI生成圖像效果 2

在配備高質量模型的情況下,合理利用AI繪圖工具,可以快速生成大量具有一定表現(xiàn)力的圖像,可用于頭腦風暴啟發(fā)設計思路;或者作為填色底圖,豐富成果表現(xiàn)內容;也可以作為前期意向圖片,提高與甲方或相關單位的溝通效果。

除了以上兩款軟件,還有很多值得一提的產品。OpenAI推出的DALL·E模型已經集成在微軟的NewBing搜索引擎,配合其獨到的ChatGPT語言模型,可以通過聊天的方式,生成高質量圖片。另外百度推出的文心一格可以通過中文提示詞生成圖像,并且也推出了參考圖功能,目前在快速發(fā)展迭代過程中。

在人工智能生成內容領域,與建筑設計高度相關的除了AI繪畫方向之外,還有AI建模,AI矢量內容生成等方向的研發(fā),現(xiàn)在已經出現(xiàn)了ShapE、Finch3D等產品。

雖然AI繪畫工具在使用中還存在一些問題,相關的應用方式也還在探索過程中。然而改變已經開始;也許在不久的將來,隨著AIGC產品的逐漸成熟,建筑行業(yè)會迎來一場深刻的的技術變革。作為本次技術變革的擁抱者與參與者,設計公司全體員工將在技術上精益求精、在創(chuàng)新上奮勇爭先,順勢而謀、因勢而為,為豐富人工智能在具體工作中的應用不懈努力。(撰稿:鄭有池)

來源:號外網


責任編輯:侯哲
熱門評論
互聯(lián)網新聞信息服務許可證10120170072
京公網安備 11010502045281號
違法和不良信息舉報電話:010-65669841
舉報郵箱:xxjb@huaxia.com

網站簡介 / 廣告服務 / 聯(lián)系我們

主辦:華夏經緯信息科技有限公司   版權所有 華夏經緯網

Copyright 2001-2024 By m.essencecafe.cn