VASA-1 z AI
Framework VASA-1 z AI od Microsoft zadebiutował całkiem niedawno i już narobił niezłego szumu w sieci. Zapewne zapytacie czym? Ano tym, że potrafi animować każde zdjęcie portretowe z dodanym dźwiękiem, do realnej postacie wraz z zaprogramowanym nastrojem. Żeby nie być gołosłownym, przykład poniżej:
VASA-1 jest w rzeczywistości modelem AI, który łączy poszczególne elementy w całość. Mając zdjęcie portretowe i plik dźwiękowy, jest w stanie w sposób bardzo realistyczny, wygenerować animację łączoną z umiejętnościami afektywnymi.
Wytwarzając ruchy ust zsynchronizowane z dźwiękiem oraz wykorzystując zaawansowane algorytmy mimiki twarzy, jest w stanie wytworzyć obraz bardzo zbliżony do rzeczywistości. Do tego wszystkiego animuje jeszcze ruchy głowy, tak by wyglądało to bardziej naturalnie. Efekt? W przypadku zwykłego zdjęcia – niesamowity.
Metoda Microsoft -u generuje obrazy wideo o rozmiarze 512×512 przy 45 klatkach na sekundę w trybie przetwarzania wsadowego offline i może obsługiwać do 40 klatek na sekundę w trybie przesyłania strumieniowego online z wcześniejszym opóźnieniem wynoszącym zaledwie 170 ms. Materiał da się obrobić na komputerze stacjonarnym z pojedynczym procesorem graficznym NVIDIA RTX 4090.
Możliwości wykorzystania
Framework VASA-1 z AI można wykorzystać na wiele sposobów. Od elementów własnego CV przesyłanego elektronicznie do firm, po oszustwa internetowe. Jedno z podobnych zastosowań opisywaliśmy w tym artykule.
Można też pokusić się o sprawienie, by treści będące w nauczaniu naszych pociech, były znacznie atrakcyjniejsze. Choćby takie animowane głowy postaci historycznych lub cyfrowy Albert Einstein mówiący w każdym języku z jego własnym akcentem. Ciekawe, prawda?
Dołóżmy jeszcze do tego konkurs piosenki zapowiadany przez samą Marlin Monroe… Szok!
Przyszłość
Chwilowo jak sami to widzicie, animacje nie są nazbyt dokładne. Z czasem jednak ma się to drastycznie zmienić. Tradycyjnie ludzie wykorzystają to do dobrych celów, ale też skusi wszelkiej maści oszustów. Już widzę te nowoczesne cyberataki „na wnuczka”, tylko tym razem przez telefon i z zastosowaniem metody spoofingu1. Kto to odróżni od realności?
Czasami sam zastanawiam się co jeszcze spotka mnie w niedalekiej przyszłości. Jakie nowe rozwiązania pojawią się niebawem w zastosowaniu. czy sztuczna inteligencja (AI), będzie w stanie rozwiązać nasze problemy? Cóż… Odpowiedź zapewne poznamy wkrótce, a póki co…
Do następnego!
- Spoofing (ang. naciąganie)– metoda oszustwa polegająca na podszywaniu się pod czyjś numer telefonu. ↩︎