Kontext
Před tím, než se stalo možné casually chatovat s PDF v ChatGPT, byla mezera pro lidi, kteří chtěli rychlý, lokální, nativní zážitek pro hlubokou interakci s výzkumnými papery. ViewAI byl vybudován k vyplnění této potřeby.
Co to bylo
ViewAI byla nativní macOS aplikace navržená Kryštofem Mitkou. Umožňovala uživatelům otevřít jakýkoli vědecký paper (PDF), prohlížet ho čistě ve dvoupanelovém layoutu a okamžitě klást otázky o obsahu pomocí GPT-4-poháněného retrieval-augmented generation (RAG) stacku.
Byla vybudována v době, kdy neexistovaly žádné snadné, off-the-shelf nástroje k dosažení tohoto s rychlostí, kvalitou a lokální kontrolou. Všechno od parsování po vector search muselo být custom vybudováno.
Funkce
- Lokální parsing PDF pomocí Nougat pro extrakci struktury
- LaTeX math rendering podpora
- Embedded vector search on-device pomocí vědeckých textových chunků
- GPT-4 používané pro odpovídání na otázky prostřednictvím RAG architektury
- Čisté nativní UI/UX ve Swift, zaměřené na rychlost a jednoduchost
Tech Stack
- Swift (nativní macOS)
- Nougat (pro PDF na strukturovaná data)
- LaTeX rendering engine
- GPT-4 API
- Vlastní vector embedding store
Výsledek
ViewAI sloužilo jako raný náhled do toho, jak by mohly vypadat user-friendly, AI-native rozhraní pro akademickou práci. Pomohlo validovat poptávku po strukturovaných, chytrých interakcích s vědeckým obsahem—dlouho před tím, než mainstream tooling dohnal.
Byl to malý, ale ostrý experiment, který Kryštof vedl a realizoval, ukazující co bylo možné se správnou kombinací AI infrastruktury a produktové intuice.
