Google otworzył API dla OCR
Web Services / / December 24, 2019
Tak, oni pracować w Google Books pewnością przyniesie dobre rezultaty, możemy zacząć czerpać. A teraz powiem ci, jak to zrobić.
Zeskanowane dokumenty nie zawsze wymaga transformacji w tekście. Ale czasami nie chce się uzyskać żadnej umowy ponownie, a kopia elektroniczna coś i nie. Oczywiście, można użyć jakiś tani programu OCR, przechodząc ze skanerem lub nawet go kupić (nie kradną ci) FineReader. Ale wolne oprogramowanie komputerowe OCR działa również dlatego teraz teksty są coraz częściej fotografowana, nie skanowane.
Aby pobrać żadnych zdjęć (jpeg, png, gif) z funkcją rozpoznawania tekstu do późniejszego Google API i otwarty w Dokumentach Google. Teraz możesz przesłać zdjęcia do biblioteki dokumentów, a serwer Google będzie przekształcić go w tekście.
Istnieje również przykład aplikacja, która pokazuje jak API:
Ale ty, programiści powinni myśleć o tworzeniu własnego interfejsu do tych możliwości. Na przykład - czy masz skany książek w PNG? Jest to wypaczenie, prawda? Więc nie masz karty w ręku - napisać aplikację, która ładuje stronę tekstu na jednej stronie, nie narusza granice i łączy cały ładunek w jednym tekście.
Należy jednak pamiętać, istnieją ograniczenia w API, a głównym z nich, wydaje mi się - coś, co jest rozpoznawany tylko łacina tak szybko, jak to. Również należy zwrócić uwagę na wysokość znaków nie jest mniejsza niż 10 pikseli, a łączna wielkość obrazu nie przekracza 10 megapikseli.