Stability AI predstavio Stable Diffusion 3 Medium sa naprednim fotorealističnim mogućnostima

Stability AI je danas lansirao Stable Diffusion 3 Medium, koji britanski startup naziva svojim “najnaprednijim modelom za generisanje slika na osnovu teksta do sada.”

Sastavljen od 2 milijarde parametara, SD3 Medium obećava fotorealistične rezultate uz jednostavnu upotrebu. Ključno je da model može generisati ove slike dok radi na pojedinačnim sistemima korisnika.

Takođe, kako je saopštila kompanija, prevazilazi i uobičajene artefakte na rukama i licima.

Stability AI je izgradila SD3 Medium da razume složene upite koji uključuju prostorne odnose, kompozicijske elemente, radnje i stilove. Tipografija je takođe poboljšana, a Stability opisuje tačnost generisanja teksta kao “neviđenu.” Kompanija pripisuje ova poboljšanja arhitekturi Diffusion Transformer.

Još jedna ključna prednost je veličina modela. Sa 2 milijarde parametara, model je manji od mnogih Stable Diffusion 3 modela, koji se kreću od 800 miliona do 8 milijardi parametara.

Stability AI će nastaviti da pomera granice generativne A

Zahvaljujući malom VRAM otisku, SD3 Medium je “idealan” za rad na standardnim potrošačkim GPU-ovima bez degradacije performansi, saopštila je kompanija. Takođe može apsorbovati suptilne detalje iz malih datasetova, što poboljšava prilagodljivost.

Christian Laforte, ko-izvršni direktor Stability AI-a, rekao je za TNW da startup planira kontinuirano unapređivanje modela. “Stability AI će nastaviti da pomera granice generativne AI i cilja da zadrži svoju vodeću poziciju u oblasti generisanja slika,” rekao je on.

Korisnici sada mogu testirati SD3 Medium putem Stability-ovog API-ja. Težine modela su dostupne pod otvorenom nekomercijalnom licencom i jeftinom Creator licencom. Svi zainteresovani za komercijalnu upotrebu u velikom obimu mogu kontaktirati startup za detalje o licenciranju.

Prijavi se na nedeljni Benchmark newsletter

Hvala!

Uspešno ste se prijavili na na naš newsletter! Proverite vaš email nalog kako bi potvrdili prijavu.

SD3 Medium dolazi u turbulentnim vremenima za Stability. Osnovan 2020. godine, startup je brzo stekao priznanje kao jedan od vodećih u oblasti generativne AI. Uz rivale Midjourney i OpenAI-jev Dall-E, Stable Diffusion je dospeo u vrh novonastalog podsektora generisanja slika na osnovu teksta. U 2022. godini, investitori su startup procenili na milijardu dolara.

Međutim, od tada su kompaniju zahvatile brojne tužbe i finansijski problemi. Umetnici su tužili kompaniju zbog treniranja AI modela na njihovim radovima bez dozvole. Stability je takođe razmatrala prodaju suočena sa finansijskom krizom, kako je izvestio The Information prošlog meseca.

Kako su se problemi gomilali, izvršni direktor i osnivač kompanije, Emad Mostaque, podneo je ostavku u martu. Mostaque je rekao da napušta kompaniju kako bi se posvetio decentralizovanoj AI. Međutim, softver je konstantno impresionirao. Slike iz SD3 Medium sugerišu da su performanse dodatno poboljšane, prenosi Thenextweb.

Dalja unapređenja su već u pripremi i to ne samo za slike. Prema Laforte-u, kompanija se takođe fokusira na “multimodalne napore kroz video, audio i jezik.”

Source link

Stability AI je danas lansirao Stable Diffusion 3 Medium, koji britanski startup naziva svojim “najnaprednijim modelom za generisanje slika na osnovu teksta do sada.” Sastavljen od 2 milijarde parametara, SD3 Medium obećava fotorealistične rezultate uz…