Jump to content

Stable Diffusion

Nga Wikipedia, enciklopedia e lirë
Stable Diffusion
Një imazh i gjeneruar me anë të Stable Diffusion bazuar në dritaren e tekstit "një fotografi e një astronauti duke ngarë një kalë"
AutorRunway, CompVis, and Stability AI
ZhvilluesStability AI
Versioni i parë22 Gusht 2022
Versioni i funditSDXL 1.0 (model)[1] / 26 Korrik 2023
Gjuhet e programimitPython[2]
Përdoret përModel tekst-në-imazh
LicencaCreative ML OpenRAIL-M

Stable Diffusion është një model i mësimit të thellë, tekst-në-imazh i lëshuar në vitin 2022 bazuar në teknikat e difuzionit . Teknologjia gjeneruese e inteligjencës artificiale është produkti kryesor i Stability AI dhe konsiderohet të jetë pjesë e bumit në vazhdim të inteligjencës artificiale .

Përdoret kryesisht për të gjeneruar imazhe të detajuara të kushtëzuara nga përshkrimet e tekstit, megjithëse mund të zbatohet edhe për detyra të tjera, si p.sh. pikturimi i brendshëm, pikturimi i jashtëm dhe gjenerimi i përkthimeve imazh-për-imazh të udhëhequr nga një dritare teksti . [3] Zhvillimi i tij përfshiu studiues nga Grupi CompVis në Universitetin Ludwig Maximilian të Mynihut dhe Runway me një dhurim llogaritës nga Stability dhe të dhëna trajnimi nga organizata jofitimprurëse. [4] [5] [6]

Difuzioni i qëndrueshëm është një model i difuzionit të fjetur, një lloj rrjeti neural artificial gjenerues i thellë. Kodi i tij dhe peshat e modelit janë lëshuar publikisht, [7] dhe mund të funksionojë në shumicën e pajisjeve të konsumatorit të pajisur me një GPU modeste me të paktën 4 GB VRAM . Kjo shënoi një largim nga modelet e mëparshme pronësore tekst-në-imazh si DALL-E dhe Midjourney, të cilat ishin të aksesueshme vetëm nëpërmjet shërbimeve cloud . [8]

  1. ^ "Announcing SDXL 1.0". stability.ai. Arkivuar nga origjinali më 26 korrik 2023. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  2. ^ Ryan O'Connor (23 gusht 2022). "How to Run Stable Diffusion Locally to Generate Images". Arkivuar nga origjinali më 13 tetor 2023. Marrë më 4 maj 2023. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  3. ^ "Diffuse The Rest - a Hugging Face Space by huggingface". huggingface.co. Arkivuar nga origjinali më 2022-09-05. Marrë më 2022-09-05. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  4. ^ "Leaked deck raises questions over Stability AI's Series A pitch to investors". sifted.eu. Arkivuar nga origjinali më 29 qershor 2023. Marrë më 2023-06-20. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  5. ^ "Revolutionizing image generation by AI: Turning text into images". www.lmu.de. Arkivuar nga origjinali më 17 shtator 2022. Marrë më 2023-06-21. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  6. ^ Mostaque, Emad (2 nëntor 2022). "Stable Diffusion came from the Machine Vision & Learning research group (CompVis) @LMU_Muenchen". Twitter (në anglisht). Arkivuar nga origjinali më 20 korrik 2023. Marrë më 2023-06-22.
  7. ^ "Stable Diffusion Repository on GitHub". CompVis - Machine Vision and Learning Research Group, LMU Munich. 17 shtator 2022. Arkivuar nga origjinali më 18 janar 2023. Marrë më 17 shtator 2022. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  8. ^ "The new killer app: Creating AI art will absolutely crush your PC". PCWorld. Arkivuar nga origjinali më 2022-08-31. Marrë më 2022-08-31. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)