LJSear.ch - usługa dla tych, którzy potrzebują pliki „Live Journal”
Web Services / / December 24, 2019
Chcesz znaleźć się w „Learn” stuletniej rekordu, ale nie może, ponieważ opcje wyszukiwania są ograniczone do jednego miesiąca? Będziesz usługa bezpłatna LJSear.ch, Który zawiera archiwa rosyjskojęzycznego LiveJournal na lata 2000-2015. Mówić o nim jego twórca Roman Iwanow (kukutz).
Roman Iwanow
Product Manager w "Yandex". Rozpoczęła przeszukiwanie blogu, spersonalizowane wyszukiwanie „Yandex”, kilka wersji „Yandex. Poczta „Usługi” Yandex. Lenta "" Ya.ru "" Yandex. Zdjęcia „i kilka innych. Obecnie jest zaangażowany w „Yandex. Browser „i LJSear.ch.
Co jest LJSear.ch?
„Learn” To więcej niż archiwów terabajtowych. Indeksowane i dostępne do wyszukiwania 340 mln posty i komentarze 1 mld od 2000 do jesieni 2015 roku. A wszystko to ze znajomy blog narzędzia wyszukiwania: Limit według autora według daty, przez społeczność.
Nowe wpisy nie są indeksowane, co uważamy za nasz projekt jako archiwum, pamiątkową.
Projekt jest całkowicie non-profit, brak reklam, oraz inne sposoby zarabiania pieniędzy nie ma.
Dlaczego muszę usługę?
Na jesieni 2015 r możliwością wyszukiwania na blogach „Yandex” były ograniczone tylko do ostatniego miesiąca. Wyjaśnienie było proste: większość ludzi szuka informacjaZwiązany z ostatnich rekordów, a głęboko wyszukiwania dla nich jest zbędne.
To prawda. Ostatni miesiąc wystarczy do zadań, takich jak regularne monitorowanie lub opinii wyszukiwania próżność niektórych ostatnich wydarzeń. Ale nie jest to problem i głębsze badania.
Wierzę, że w „Learn” się stało, albo przynajmniej prawie wszystko znalazło odzwierciedlenie rosyjskojęzycznej kulturę zerowych lat. Wartość tego archiwum jest nie do przecenienia. Kiedy „Yandex” ma zamkniętą przeszukiwanie archiwum, jestem bardzo rozczarowany, bo przekonani, że ten zbiór informacji musi być zachowana dla ludzkości. No a ja zapytałem: „Yandex” archiwów, a on nagle zgodził się i dał im.
Archiwum bloga dość wyjątkowa, bo tyle nie można pobrać w „Learn”. Wiele magazynów są usuwane przez ich autorów, niektóre połamane i zniszczone przez hakerów, w niektórych przypadkach, zapisy nie są usunięte, lecz ukryte pod kluczem.
Przez ostatnie sześć miesięcy na I odpowiedzialny za zapewnienie, że dane nie są tracone było. Zadzwoniłem na pomoc przyjaciół, a wśród nich byli tacy, którzy zgodzili się pomóc zrozumieć, czy możemy udostępnić informacje dla wyszukiwania. Stworzyliśmy LJSear.ch usług i podobno doprowadził go do stanu używalności.
Ochotnicy byli wielu?
Stwierdzono. Znany ekspert w dziedzinie UX Kohl Zayarny Wpadłem projektu. Sasha Belyanskiy Wziąłem BEM-vorstku i frontend na Node.js. Spaceinvaderz zaangażowany podawanie układowe. programowanie w PHP backend Zacząłem na podstawie samego prototypu, co sprawiło, przyjacielu Tobe.
Największym problemem był żelaza: kto zapłaci za hosting? Znajomi pewność, że można zebrać pieniądze dla kraudfandingovyh stron, ale byłem sceptyczny. I tam są wspaniali ludzie, przyszedł do nas z Servers.ru i zaoferował pomoc. W efekcie mamy wielką serwera dedykowanego z SSD do indeksowania i wyszukiwania backend oraz cloud serwer wirtualny do frontend.
Kto może być zainteresowany w projekcie?
Jak nowe zapisy nie są indeksowane, publiczność, która Sądzę - są naukowcy. Jak dosłownie badaczy warstwy kulturowe zerowych lat, a obecnego lub byłego użytkowników „Learn”, którzy chcą, aby znaleźć coś, co zostało napisane w tych latach. A ponieważ nie ograniczają maksymalne szukane czas realizacji: badacz może czekać na złożonych zapytań i minutę, a dwa. Oczywiście, proste zapytania są wykonywane szybko, a jeśli usługa wykryje, że zapytanie jest teraz dużo, zawiera kontrolowanej degradacji, włącznie granicach limitu czasu żądania.
LJSear.ch →