Naukowcy z Europejskiej Organizacji Badań Jądrowych (CERN), Ecole Polytechnique Fédérale de Lausanne (EPFL) i innych instytucji opracowali hybrydowy kwantowo-klasyczny model generatywny o nazwie Latent Style-based Quantum GAN (LaSt-QGAN) do generowania obrazów wysokiej jakości. Model ten wykorzystuje klasyczny autoenkoder do redukcji wymiarowości złożonych obrazów oraz kwantową sieć GAN do uczenia się ukrytej reprezentacji obrazów. Wyniki empiryczne zespołu pokazują, że LaSt-QGAN może skutecznie syntetyzować obrazy o lepszym poziomie jakości niż klasyczny odpowiednik przy użyciu mniej więcej tych samych zasobów.
Quantum Generative Modeling: Podejście hybrydowe
Kwantowe modelowanie generatywne jest obiecującą dziedziną analizy danych, która może zaoferować praktyczne korzyści w porównaniu z klasycznym uczeniem maszynowym. Jednak generowanie obrazów o dużych rozmiarach porównywalnych z tymi wytwarzanymi przez klasyczne odpowiedniki pozostaje poważnym wyzwaniem. Niniejszy artykuł przedstawia nowatorskie podejście, kwantową sieć adwersarzy opartą na stylu ukrytym (LaSt-QGAN), która wykorzystuje hybrydowe podejście klasyczno-kwantowe do generowania złożonych danych.
Ramy LaSt-QGAN
LaSt-QGAN integruje dwa odrębne komponenty: klasyczny autoenkoder i kwantową sieć GAN. Autoenkoder, nienadzorowana sieć neuronowa, służy do redukcji wymiarowości i kompresji danych. Składa się z kodera, który osadza wielowymiarowe dane w niższej przestrzeni ukrytej, oraz dekodera, który rekonstruuje dane z tych ukrytych cech. Kwantowa sieć GAN służy jako model generatywny do tworzenia fałszywych cech, wykorzystując generator kwantowy i klasyczny dyskryminator.
Wyniki empiryczne i praktyczne zastosowania
Wyniki empiryczne pokazują, że LaSt-QGAN może skutecznie syntetyzować obrazy o lepszym poziomie jakości niż klasyczny odpowiednik przy użyciu w przybliżeniu tych samych zasobów. Kwantowa sieć GAN jest w stanie osiągnąć, a w niektórych przypadkach przewyższyć, wydajność klasycznej sieci GAN zarówno pod względem jakości, jak i różnorodności generowanych próbek we wszystkich testowanych zestawach danych, przy zachowaniu podobnej liczby parametrów możliwych do wyszkolenia.
Zjawisko jałowego płaskowyżu
Zbadano również zjawisko jałowego płaskowyżu w ciągłych modelach generatywnych. Korzystając z narzędzi analitycznych i numerycznych, wykazano, że LaSt-QGAN z wielomianowo głębokim obwodem generatora może być trenowany z inicjalizacją pod małym kątem wokół tożsamości. Pomimo tego, że krajobraz strat jest średnio wykładniczo płaski, strategia ta pozwala modelowi na inicjalizację w regionie o znacznych gradientach i trenowanie w kierunku lokalnego minimum.
Chociaż wyniki empiryczne stanowią pierwszy krok do zademonstrowania potencjału modelu w praktycznych zastosowaniach, pozostaje kwestią otwartą, czy wzajemne oddziaływanie części klasycznej i kwantowej można określić ilościowo. Dalsze badanie ciepłych startów w modelowaniu generatywnym ma szczególne znaczenie zarówno dla aspektów fundamentalnych, jak i praktycznych. Wreszcie, rola obwodu kwantowego w ciągłym modelu generatywnym jako mapy cech jest bardzo podobna do nadzorowanego kwantowego uczenia maszynowego z klasycznymi danymi, pozostawiając ogromne możliwości dla przyszłych badań.
