Optical character recognition

http://dbpedia.org/resource/Optical_character_recognition an entity of type: Thing

Texterkennung ist ein Begriff aus der Informationstechnik. Es bezeichnet die automatisierte Texterkennung bzw. automatische Schrifterkennung innerhalb von Bildern. Ursprünglich basierte die automatische Texterkennung auf optischer Zeichenerkennung (englisch optical character recognition, Abkürzung OCR). Diese Technik wird zunehmend durch neuronale Netze, die ganze Zeilen statt einzelner Zeichen verarbeiten, abgelöst. rdf:langString
La reconnaissance optique de caractères (ROC, ou OCR pour l'anglais optical character recognition), ou océrisation, désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. Un ordinateur réclame pour l'exécution de cette tâche un logiciel d'OCR. Celui-ci permet de récupérer le texte dans l'image d'un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte pour enrichissement, et stocké dans une base de données ou sur un autre support exploitable par un système informatique. rdf:langString
Is éard atá i gceist le hAithint carachtar nó Aithint Optúil Carachtar ná téacs clóscríofa, lámhscríofa nó clóite a thiontú go leictreonach nó go meicniúil ina théacs meaisín-ionchódaithe. Is teicneolaíocht atá ann a bhaineann le cumas córas ríomhairí patrúin ar leith a aithint. Uaireanta, tugtar aithint patrún uirthi. Nuair is é an cumas carachtair chlóbhuailte a léamh ó ghnáthábhair chlóbhuailte é, tugtar aithint optúil carachtar (OCR) uirthi. Teicneolaíocht eile atá an-choitianta is ea aithint carachtar dúigh mhaighnéadaigh (MICR) a úsáidtear ar fud an Domhain chun sonraí cosúil le huimhreacha cuntas bainc is sraithuimhreacha ar sheiceanna a léamh go huathoibríoch. rdf:langString
광학 문자 인식(Optical character recognition; OCR)은 사람이 쓰거나 기계로 인쇄한 문자의 영상을 이미지 스캐너로 획득하여 기계가 읽을 수 있는 문자로 변환하는 것이다. 이미지 스캔으로 얻을 수 있는 문서의 활자 영상을 컴퓨터가 편집 가능한 문자코드 등의 형식으로 변환하는 소프트웨어로써 일반적으로 OCR이라고 하며, OCR은 인공지능이나 기계 시각(machine vision)의 연구분야로 시작되었다. 거울이나 렌즈 등의 광학 기술을 이용한 광학 문자 인식과 스캐너 및 알고리즘에 의한 디지털 문자 인식은 다른 영역으로 생각되었으나 이제는 광학 문자 인식이라는 말이 디지털 문자 인식을 포함하는 것으로 간주되었다. 초기 시스템은 특정한 서체를 읽기 위해 미리 해당 서체의 샘플을 읽는 것을 뜻하는 "트레이닝"이 필요했지만, 지금은 대부분의 서체를 높은 확률로 변환이 가능하다. 몇몇 시스템에서는 읽어들인 이미지에서 그것과 거의 일치하는 워드 프로세서 파일과 같은 문서 포맷으로 된 출력 파일을 생성할 수 있으며, 그 중에는 이미지처럼 문서 이외의 부분이 포함되어있어도 제대로 인식하는 것도 있다. rdf:langString
Maskinläsningeller optisk teckenläsning (ofta förkortat OCR efter engelskans Optical Character Recognition) kallas datortekniken att med hjälp av bildanalys förvandla digitala bilder av tryckt text till bokstäver och siffror som andra datorprogram, till exempel ordbehandlare, kan använda. Den varierande kvaliteten på tryckt text kan göra denna texttydning svår ibland, så därför har många program för maskinläsning en inlärningsfunktion, där användaren kan hjälpa programmet att förstå hur vissa tecken ska tydas. rdf:langString
光学字符识别(英語:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。 rdf:langString
التعرف البصري على المحارف (بالإنجليزية: Optical character recognition)‏ أو اختصارا OCR هي نوع من البرمجيات الحاسوبية لتحويل صور النصوص المكتوبة باليد أو بآلة (يحصل عليها عادة باستخدام ) إلى نصوص يستطيع الحاسوب معالجتها.التعرف البصري على الحروف '، يختصر عادة إلى التعرف البصري على الحروف ، هو أو تحويل الصورة الممسوحة الالكترونية من صيغة مكتوبة بخط اليد، أو مطبوعة على الآلة الكاتبة أو نص مطبوع إلى نص مرمز تفهمه الآلة وتدعى . ويستخدم على نطاق واسع باعتباره شكلا من أشكال إدخال البيانات من نوع ما من ورقة البيانات المصدر الأصلي، سواء وثائق، أوايصالات مبيعات، والبريد، أو أي عدد من السجلات المطبوعة.لإنه من الأهمية بمكان أن حوسبة النصوص المطبوعة تكون مطلبا حتى يمكن أن يكون البحث عنها أوتخزينها إلكترونيا بحيث تصبح قابلة للانضغاط أكثر ليتيسر عرضها على الإنترنت، وتستخدم في عمليات آلية مثل الترجمة الآل rdf:langString
El Reconeixement Òptic de Caràcters (OCR) és una aplicació de la intel·ligència artificial que consisteix a identificar automàticament símbols o caràcters, que pertanyen a un determinat alfabet, a partir d'una imatge per emmagatzemar-ho en forma de dades amb les quals podrem interaccionar amb un programa d'edició de text o similars. Hi ha dos tipus d'OCR: l'OCR-A, dirigit a textos, i l'OCR-B, dirigit a . En els últims anys la digitalització de la informació (textos, imatges, so, etc.) s'ha convertit en un punt d'interès per la societat. rdf:langString
Optické rozpoznávání znaků či OCR (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky, nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nemusí rozeznat všechna písmena správně. OCR – zpracování textu z tištěné do elektronické podoby je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních a jehličkových tiskáren a samozřejmě pro předlohy vytištěné knihtiskem. U nevhodných předloh, např. slabě vytištěných jehličkových výtisků nebo dohromady slitých písmen, se z časového hlediska vyp rdf:langString
Η Οπτική Αναγνώριση Χαρακτήρων (αγγλικά: Optical Character Recognition) ή αλλιώς Αυτόματη Αναγνώριση Χαρακτήρων Κειμένου ονομάζεται η διαδικασία μετατροπής σαρωμένων εικόνων χειρογράφων ή έντυπων κειμένων σε κείμενο αναγνώσιμο από ηλεκτρονικό υπολογιστή. Η Οπτική Αναγνώριση Χαρακτήρων καθιστά εφικτή την εκ νέου επεξεργασία του κειμένου, αποφεύγοντας τη δακτυλογράφηση του από την αρχή. rdf:langString
Optika signorekono (OSR) aŭ tekstorekono aŭ optika karaktra rekono (angla, internacia mallongigo OCR laŭ Optical Character Recognition) estas nocio el la IT-areo, kiu priskribas la aŭtomatan tekstorekonon de (plej ofte presita) dokumento. Originale ĝi estis evoluigita al aŭtomata tekstorekono de diversaj skribotipoj, kiuj estis uzataj en ĉekoj. Tiuj skribotipoj estis tiel formitaj, ke la rekoniloj povis ilin – sen grava kalkula bezono – deĉifri, dividi inter ili. Tiel la skribotipo OCR-A estas uzata por tre diversaj signoj, OCR-B por pli similaj signotipoj, kaj OCR-H por manskriboj. rdf:langString
El reconocimiento óptico de caracteres (ROC), generalmente conocido como reconocimiento de caracteres y expresado con frecuencia con la sigla OCR (del inglés Optical Character Recognition), es un proceso dirigido a la digitalización de textos, los cuales identifican automáticamente a partir de una imagen símbolos o caracteres que pertenecen a un determinado alfabeto, para luego almacenarlos en forma de datos. Así podremos interactuar con estos mediante un programa de edición de texto o similar. rdf:langString
Karaktereen ezagutze optikoa (ingelesetik, Optical Character Recognition edo OCR), idazmakinaz edo eskuz idatzita, edo paperean inprimatuta, dauden testuak, makina-kode gisa gordetako testu bihurtzea da. Horrela, hauekin lan egitea posible izango litzateke testu-editore baten bitartez. rdf:langString
Optical character recognition or optical character reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo) or from subtitle text superimposed on an image (for example: from a television broadcast). rdf:langString
Pengenalan Karakter Optik (bahasa Inggris: Optical Character Recognition, yang biasa disingkat OCR) adalah sebuah perangkat lunak yang mengubah teks dalam format berkas citra atau gambar ke dalam format teks yang bisa dibaca dan disunting oleh aplikasi komputer. Berkas teks berformat citra tersebut didapatkan dengan cara memindai atau memfoto sebuah buku, manuskrip, tulisan di papan pengumuman, ataupun materi kuliah di papan tulis dsb. Sedangkan alat yang diunakan untuk memindai adalah pemindai (scanner dalam bahasa Inggrisnya) atau kamera baik kamera DSLR ataupun kamera di ponsel pintar. rdf:langString
光学文字認識(こうがくもじにんしき、英: Optical character recognition)は、活字、手書きテキストの画像を文字コードの列に変換するソフトウェアである。画像はイメージスキャナーや写真で取り込まれた文書、風景写真(風景内の看板の文字など)、画像内の字幕(テレビ放送画像内など)が使われる。一般にOCRと略記される。 パスポート、請求書、銀行取引明細書、レシート、名刺、メール、データや文書の印刷物など、紙に記載されたデータをデータ入力する手法として広く使われ、紙に印刷された文書をデジタイズし、よりコンパクトな形で記録するのに必要とされる。さらに、文字コードに変換することでコグニティブコンピューティング、機械翻訳や音声合成の入力にも使えるようになり、テキストマイニングも可能となる。研究分野としては、パターン認識、人工知能、コンピュータビジョンが対応する。 rdf:langString
I sistemi di riconoscimento ottico dei caratteri (ROC), detti anche OCR (dall'inglese optical character recognition), sono programmi dedicati al rilevamento dei caratteri contenuti in un documento e al loro trasferimento in testo digitale leggibile da una macchina. La conversione viene effettuata solitamente tramite uno scanner. Il testo può essere convertito in formato ASCII semplice, Unicode o, nel caso dei sistemi più avanzati, in un formato contenente anche l'impaginazione del documento stesso. L'utente può modificare il risultato ottenuto con un normale editor di testo. rdf:langString
Optyczne rozpoznawanie znaków, OCR (ang. optical character recognition) – zestaw technik lub oprogramowanie służące do rozpoznawania znaków i całych tekstów w pliku graficznym o postaci rastrowej. Zadaniem OCR jest zwykle rozpoznanie tekstu w zeskanowanym dokumencie (na przykład papierowym formularzu lub stronie książki). rdf:langString
Optical character recognition (OCR), of in het Nederlands: optische tekenherkenning is een transformatie waarbij uit een afbeelding van een tekst door middel van patroonherkenning alle tekens uit de afbeelding als zodanig worden herkend en apart opgeslagen door een computer(programma). Oftewel, de tekst uit een afbeelding wordt omgezet in bewerkbare tekst. Een voorbeeld hiervan is automatische kentekenplaatherkenning. rdf:langString
OCR é um acrónimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bits sejam eles escaneados, escritos a mão, datilografados ou impressos. Dessa forma, através do OCR é possível obter um arquivo de texto editável por um computador. rdf:langString
Оптичне розпізнавання тексту (англ. optical character recognition, OCR) — це механічне або електронне переведення зображень рукописного, машинописного або друкованого тексту в послідовність кодів, що використовуються для представлення в текстовому редакторі. Розпізнавання широко використовується для конвертації книг і документів в електронний вигляд, для автоматизації систем обліку в бізнесі або для публікації тексту на вебсторінці. Оптичне розпізнавання тексту дозволяє редагувати текст, здійснювати пошук слова або фрази, зберігати його в компактнішій формі, демонструвати або роздруковувати матеріал, не втрачаючи якості, аналізувати інформацію, а також застосовувати до тексту електронний переклад, форматування або перетворення в мовлення. Оптичне розпізнавання тексту є досліджуваною пробле rdf:langString
Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные, использующиеся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко применяется для преобразования книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание символов позволяет редактировать текст, осуществлять поиск слов или фраз, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание rdf:langString
rdf:langString Optical character recognition
rdf:langString تعرف بصري على المحارف
rdf:langString Reconeixement òptic de caràcters
rdf:langString Optické rozpoznávání znaků
rdf:langString Texterkennung
rdf:langString Οπτική Αναγνώριση Χαρακτήρων
rdf:langString Optika signorekono
rdf:langString Reconocimiento óptico de caracteres
rdf:langString Karaktereen ezagutze optiko
rdf:langString Aithint carachtar
rdf:langString Pengenalan karakter optis
rdf:langString Reconnaissance optique de caractères
rdf:langString Riconoscimento ottico dei caratteri
rdf:langString 광학 문자 인식
rdf:langString 光学文字認識
rdf:langString Optyczne rozpoznawanie znaków
rdf:langString Optical character recognition
rdf:langString Оптическое распознавание символов
rdf:langString Reconhecimento ótico de caracteres
rdf:langString Maskinläsning
rdf:langString Оптичне розпізнавання символів
rdf:langString 光学字符识别
xsd:integer 49091
xsd:integer 1124850396
rdf:langString التعرف البصري على المحارف (بالإنجليزية: Optical character recognition)‏ أو اختصارا OCR هي نوع من البرمجيات الحاسوبية لتحويل صور النصوص المكتوبة باليد أو بآلة (يحصل عليها عادة باستخدام ) إلى نصوص يستطيع الحاسوب معالجتها.التعرف البصري على الحروف '، يختصر عادة إلى التعرف البصري على الحروف ، هو أو تحويل الصورة الممسوحة الالكترونية من صيغة مكتوبة بخط اليد، أو مطبوعة على الآلة الكاتبة أو نص مطبوع إلى نص مرمز تفهمه الآلة وتدعى . ويستخدم على نطاق واسع باعتباره شكلا من أشكال إدخال البيانات من نوع ما من ورقة البيانات المصدر الأصلي، سواء وثائق، أوايصالات مبيعات، والبريد، أو أي عدد من السجلات المطبوعة.لإنه من الأهمية بمكان أن حوسبة النصوص المطبوعة تكون مطلبا حتى يمكن أن يكون البحث عنها أوتخزينها إلكترونيا بحيث تصبح قابلة للانضغاط أكثر ليتيسر عرضها على الإنترنت، وتستخدم في عمليات آلية مثل الترجمة الآلية، تحويل . التعرف البصري على الحروف هو مجال البحث في التعرف على النماذج، الذكاء الاصطناعي . هناك حاجة لإصدارات في وقت مبكر حتى يتسنى أن تبرمج الصور تبعا لكل حرف، وتعمل على خط واحد في وقت واحد. النظام «الذكي» مع وجود درجة عالية من دقة التعرف على معظم الخطوط أصبحت شائعة الآن. بعض الأنظمة الآن قادرة على إنتاج حروف تمت تهيئتها formatted output وهي تقترب كثيرا من الشكل الأصلي بما في ذلك الصور الممسوحة بصريا، والأعمدة وغيرها من العناصر غير النصية.
rdf:langString El Reconeixement Òptic de Caràcters (OCR) és una aplicació de la intel·ligència artificial que consisteix a identificar automàticament símbols o caràcters, que pertanyen a un determinat alfabet, a partir d'una imatge per emmagatzemar-ho en forma de dades amb les quals podrem interaccionar amb un programa d'edició de text o similars. Hi ha dos tipus d'OCR: l'OCR-A, dirigit a textos, i l'OCR-B, dirigit a . En els últims anys la digitalització de la informació (textos, imatges, so, etc.) s'ha convertit en un punt d'interès per la societat. En el cas concret dels textos, existeixen i es generen contínuament grans quantitats d'informació escrita, tipogràfica o manuscrita en tota mena de suport.Amb aquest context, poder automatitzar la introducció de caràcters evitant l'entrada per teclat, implica un important estalvi de recursos humans i un augment de la productivitat al mateix temps que es manté o fins i tot es millora la qualitat de molts serveis. El Reconeixement Òptic de Caràcters (OCR), així com el reconeixement de text, en general són aplicacions dirigides a la digitalització de textos.
rdf:langString Optické rozpoznávání znaků či OCR (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky, nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nemusí rozeznat všechna písmena správně. OCR – zpracování textu z tištěné do elektronické podoby je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních a jehličkových tiskáren a samozřejmě pro předlohy vytištěné knihtiskem. U nevhodných předloh, např. slabě vytištěných jehličkových výtisků nebo dohromady slitých písmen, se z časového hlediska vyplatí spíše přepis textu. Pro snadné rozpoznávání znaků byly vyvinuty strojově čitelné fonty, např. , nebo dnes používanější OCR-B.
rdf:langString Η Οπτική Αναγνώριση Χαρακτήρων (αγγλικά: Optical Character Recognition) ή αλλιώς Αυτόματη Αναγνώριση Χαρακτήρων Κειμένου ονομάζεται η διαδικασία μετατροπής σαρωμένων εικόνων χειρογράφων ή έντυπων κειμένων σε κείμενο αναγνώσιμο από ηλεκτρονικό υπολογιστή. Η Οπτική Αναγνώριση Χαρακτήρων καθιστά εφικτή την εκ νέου επεξεργασία του κειμένου, αποφεύγοντας τη δακτυλογράφηση του από την αρχή. Τα συστήματα Οπτικής Αναγνώρισης Χαρακτήρων απαιτούν βαθμονόμηση για να διαβάσουν μια συγκεκριμένη γραμματοσειρά. Οι πρώτες εκδόσεις ήταν προγραμματισμένες με εικόνες για κάθε χαρακτήρα και δούλευαν μια γραμματοσειρά τη φορά. Τα ευφυή συστήματα με υψηλό δείκτη αναγνώρισης είναι πλέον κοινά. Μερικά συστήματα είναι ικανά να αναπαράγουν ακόμη και τις πληροφορίες που δεν είναι κείμενο σε ένα έγγραφο, όπως εικόνες, στήλες, γραμμές, γωνίες κτλ.
rdf:langString Texterkennung ist ein Begriff aus der Informationstechnik. Es bezeichnet die automatisierte Texterkennung bzw. automatische Schrifterkennung innerhalb von Bildern. Ursprünglich basierte die automatische Texterkennung auf optischer Zeichenerkennung (englisch optical character recognition, Abkürzung OCR). Diese Technik wird zunehmend durch neuronale Netze, die ganze Zeilen statt einzelner Zeichen verarbeiten, abgelöst.
rdf:langString Optika signorekono (OSR) aŭ tekstorekono aŭ optika karaktra rekono (angla, internacia mallongigo OCR laŭ Optical Character Recognition) estas nocio el la IT-areo, kiu priskribas la aŭtomatan tekstorekonon de (plej ofte presita) dokumento. Originale ĝi estis evoluigita al aŭtomata tekstorekono de diversaj skribotipoj, kiuj estis uzataj en ĉekoj. Tiuj skribotipoj estis tiel formitaj, ke la rekoniloj povis ilin – sen grava kalkula bezono – deĉifri, dividi inter ili. Tiel la skribotipo OCR-A estas uzata por tre diversaj signoj, OCR-B por pli similaj signotipoj, kaj OCR-H por manskriboj. La kreskantaj povumoj de la moderna komputilo kaj la pliboniĝantaj algoritmoj ebligas ankaŭ la rekonon de "normalaj" presitaj signoj ĝis la manskriboj (tiu lasta gravas ekz. ĉe leterodistribuo en la poŝto). La moderna tekstorekono entenas la rekonon de la diversaj litertipoj kaj -grandoj kaj tiel certigas la preskaŭ plej originalfidelan reaperigon.
rdf:langString Karaktereen ezagutze optikoa (ingelesetik, Optical Character Recognition edo OCR), idazmakinaz edo eskuz idatzita, edo paperean inprimatuta, dauden testuak, makina-kode gisa gordetako testu bihurtzea da. Horrela, hauekin lan egitea posible izango litzateke testu-editore baten bitartez. Azken urteotan, informazioaren digitalizazioa (testuak, irudiak, soinua, eta abar) gero eta interesgarriago bihurtu da gizartean. Testuen kasuan, informazio mota idatzien edo tipografikoen kopuru handiak etengabe sortzen jarraitu da. Testuinguru honetan, karaktereak sartzeko garaian, teklatuaren sarrera saihesteak, giza baliabideen aurrezpen garrantzitsua eta produktibitatea areagotzea dakar eta gainera, zerbitzuen kalitatea mantendu edo hobetu.
rdf:langString La reconnaissance optique de caractères (ROC, ou OCR pour l'anglais optical character recognition), ou océrisation, désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. Un ordinateur réclame pour l'exécution de cette tâche un logiciel d'OCR. Celui-ci permet de récupérer le texte dans l'image d'un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte pour enrichissement, et stocké dans une base de données ou sur un autre support exploitable par un système informatique.
rdf:langString El reconocimiento óptico de caracteres (ROC), generalmente conocido como reconocimiento de caracteres y expresado con frecuencia con la sigla OCR (del inglés Optical Character Recognition), es un proceso dirigido a la digitalización de textos, los cuales identifican automáticamente a partir de una imagen símbolos o caracteres que pertenecen a un determinado alfabeto, para luego almacenarlos en forma de datos. Así podremos interactuar con estos mediante un programa de edición de texto o similar. En los últimos años la digitalización de la información (textos, imágenes, sonido, etcétera) ha devenido un punto de interés para la sociedad. En el caso concreto de los textos, existen y se generan continuamente grandes cantidades de información escrita, tipográfica o manuscrita en todo tipo de soportes. En este contexto, poder automatizar la introducción de caracteres evitando la entrada por teclado implica un importante ahorro de recursos humanos y un aumento de la productividad, al mismo tiempo que se mantiene, o hasta se mejora, la calidad de muchos servicios.
rdf:langString Optical character recognition or optical character reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo) or from subtitle text superimposed on an image (for example: from a television broadcast). Widely used as a form of data entry from printed paper data records – whether passport documents, invoices, bank statements, computerized receipts, business cards, mail, printouts of static-data, or any suitable documentation – it is a common method of digitizing printed texts so that they can be electronically edited, searched, stored more compactly, displayed on-line, and used in machine processes such as cognitive computing, machine translation, (extracted) text-to-speech, key data and text mining. OCR is a field of research in pattern recognition, artificial intelligence and computer vision. Early versions needed to be trained with images of each character, and worked on one font at a time. Advanced systems capable of producing a high degree of recognition accuracy for most fonts are now common, and with support for a variety of digital image file format inputs. Some systems are capable of reproducing formatted output that closely approximates the original page including images, columns, and other non-textual components.
rdf:langString Is éard atá i gceist le hAithint carachtar nó Aithint Optúil Carachtar ná téacs clóscríofa, lámhscríofa nó clóite a thiontú go leictreonach nó go meicniúil ina théacs meaisín-ionchódaithe. Is teicneolaíocht atá ann a bhaineann le cumas córas ríomhairí patrúin ar leith a aithint. Uaireanta, tugtar aithint patrún uirthi. Nuair is é an cumas carachtair chlóbhuailte a léamh ó ghnáthábhair chlóbhuailte é, tugtar aithint optúil carachtar (OCR) uirthi. Teicneolaíocht eile atá an-choitianta is ea aithint carachtar dúigh mhaighnéadaigh (MICR) a úsáidtear ar fud an Domhain chun sonraí cosúil le huimhreacha cuntas bainc is sraithuimhreacha ar sheiceanna a léamh go huathoibríoch.
rdf:langString Pengenalan Karakter Optik (bahasa Inggris: Optical Character Recognition, yang biasa disingkat OCR) adalah sebuah perangkat lunak yang mengubah teks dalam format berkas citra atau gambar ke dalam format teks yang bisa dibaca dan disunting oleh aplikasi komputer. Berkas teks berformat citra tersebut didapatkan dengan cara memindai atau memfoto sebuah buku, manuskrip, tulisan di papan pengumuman, ataupun materi kuliah di papan tulis dsb. Sedangkan alat yang diunakan untuk memindai adalah pemindai (scanner dalam bahasa Inggrisnya) atau kamera baik kamera DSLR ataupun kamera di ponsel pintar. Sebagai perangkat lunak yang kompleks, OCR diterapkan di berbagai bidang seperti untuk membaca data secara otomatis dan langsung memasukkannya ke dalam basis data -- contohnya seperti dalam pemindaian passport, nota transfer bank, kertas berharga – untuk pengenalan pelat kendaraan bermotor dari video atau gambar yang tertangkap kamera, dan yang paling marak adalah untuk preservasi konten buku-buku sumber referensi utama dan manuskrip bersejarah. Dalam beberapa kasus, OCR berkontribusi sangat besar dalam proses pembangunan perpustakaan digital.
rdf:langString I sistemi di riconoscimento ottico dei caratteri (ROC), detti anche OCR (dall'inglese optical character recognition), sono programmi dedicati al rilevamento dei caratteri contenuti in un documento e al loro trasferimento in testo digitale leggibile da una macchina. La conversione viene effettuata solitamente tramite uno scanner. Il testo può essere convertito in formato ASCII semplice, Unicode o, nel caso dei sistemi più avanzati, in un formato contenente anche l'impaginazione del documento stesso. L'utente può modificare il risultato ottenuto con un normale editor di testo. L'OCR è un campo di ricerca dell'intelligenza artificiale, della visione artificiale e del riconoscimento di pattern, legati al riconoscimento delle immagini.
rdf:langString 광학 문자 인식(Optical character recognition; OCR)은 사람이 쓰거나 기계로 인쇄한 문자의 영상을 이미지 스캐너로 획득하여 기계가 읽을 수 있는 문자로 변환하는 것이다. 이미지 스캔으로 얻을 수 있는 문서의 활자 영상을 컴퓨터가 편집 가능한 문자코드 등의 형식으로 변환하는 소프트웨어로써 일반적으로 OCR이라고 하며, OCR은 인공지능이나 기계 시각(machine vision)의 연구분야로 시작되었다. 거울이나 렌즈 등의 광학 기술을 이용한 광학 문자 인식과 스캐너 및 알고리즘에 의한 디지털 문자 인식은 다른 영역으로 생각되었으나 이제는 광학 문자 인식이라는 말이 디지털 문자 인식을 포함하는 것으로 간주되었다. 초기 시스템은 특정한 서체를 읽기 위해 미리 해당 서체의 샘플을 읽는 것을 뜻하는 "트레이닝"이 필요했지만, 지금은 대부분의 서체를 높은 확률로 변환이 가능하다. 몇몇 시스템에서는 읽어들인 이미지에서 그것과 거의 일치하는 워드 프로세서 파일과 같은 문서 포맷으로 된 출력 파일을 생성할 수 있으며, 그 중에는 이미지처럼 문서 이외의 부분이 포함되어있어도 제대로 인식하는 것도 있다.
rdf:langString 光学文字認識(こうがくもじにんしき、英: Optical character recognition)は、活字、手書きテキストの画像を文字コードの列に変換するソフトウェアである。画像はイメージスキャナーや写真で取り込まれた文書、風景写真(風景内の看板の文字など)、画像内の字幕(テレビ放送画像内など)が使われる。一般にOCRと略記される。 パスポート、請求書、銀行取引明細書、レシート、名刺、メール、データや文書の印刷物など、紙に記載されたデータをデータ入力する手法として広く使われ、紙に印刷された文書をデジタイズし、よりコンパクトな形で記録するのに必要とされる。さらに、文字コードに変換することでコグニティブコンピューティング、機械翻訳や音声合成の入力にも使えるようになり、テキストマイニングも可能となる。研究分野としては、パターン認識、人工知能、コンピュータビジョンが対応する。 初期のシステムは特定の書体を読むための「トレーニング」が必要であった(事前にその書体のサンプルを読ませることを意味する)。現在では、ほとんどの書体を高い識字率で変換することが可能である。いくつかのシステムでは読み込まれた画像からそれとほぼ同じになるようフォーマットされた出力(例えば、ワードプロセッサのファイルのようなもの)を生成することが可能であり、中には画像などの文書以外の部分が含まれていても正しく認識するものもある。
rdf:langString Optical character recognition (OCR), of in het Nederlands: optische tekenherkenning is een transformatie waarbij uit een afbeelding van een tekst door middel van patroonherkenning alle tekens uit de afbeelding als zodanig worden herkend en apart opgeslagen door een computer(programma). Oftewel, de tekst uit een afbeelding wordt omgezet in bewerkbare tekst. Een voorbeeld hiervan is automatische kentekenplaatherkenning. Meestal wordt een scanner gebruikt om een afbeelding van het papier te maken en naar de computer te sturen. De afbeelding wordt meestal aangemaakt met een resolutie van 150-300 dpi en opgeslagen in het TIFF-formaat. Wanneer alle tekens herkend zijn kan de OCR-software verschillende bewerkingen uitvoeren. De bekendste bewerking is het opslaan van de tekens in een verder bewerkbaar bestandsformaat, waarbij dikwijls zowel de taal van het origineel, als de fonts en de opmaak worden gereproduceerd. In dit geval wordt het een "full text OCR" genoemd. Door OCR neemt een pagina met tekst nog maar een paar kilobyte aan geheugenopslag in. Bovendien is hij daarna weer bewerkbaar in een tekstverwerker. Belangrijk is ook dat de tekst nu doorzoekbaar kan worden gemaakt, bijvoorbeeld in een digitale bibliotheek of in een zoekmachine.
rdf:langString Optyczne rozpoznawanie znaków, OCR (ang. optical character recognition) – zestaw technik lub oprogramowanie służące do rozpoznawania znaków i całych tekstów w pliku graficznym o postaci rastrowej. Zadaniem OCR jest zwykle rozpoznanie tekstu w zeskanowanym dokumencie (na przykład papierowym formularzu lub stronie książki). Niegdyś termin oznaczał samo rozpoznawanie ciągów znaków, głównie drukowanych, które są łatwiejsze do rozpoznania, dziś również pisma odręcznego oraz cech formatowania, jak krój pisma, stopień pisma, interlinia (techniki służące do tego typu zaawansowanego rozpoznawania nazywane są terminem ICR), a nawet układów tabelarycznych. Techniki optycznego rozpoznawania znaków stosowane są, między innymi, przy digitalizacji zasobów bibliotek, a także jako ułatwienie przy odczytywaniu danych z formularzy wypełnianych pismem odręcznym. W obu przypadkach oprogramowanie OCR nie jest tak skuteczne jak człowiek, zatem w przypadkach wątpliwych (trudności z odczytaniem fragmentu) oraz w celu uniknięcia błędów nieodzowna jest weryfikacja wyniku OCR przez człowieka. Nowoczesną metodą współpracy oprogramowania OCR z ludźmi jest technika reCAPTCHA. Nie wymaga ona zatrudniania osób specjalnie do weryfikacji OCR, lecz wykorzystuje rozproszoną aktywność milionów użytkowników Internetu, którzy wchodząc na strony internetowe zabezpieczone przez CAPTCHA rozpoznają fragmenty tekstu wymagające weryfikacji. Postęp w optycznym rozpoznawaniu znaków jest bardzo widoczny – drogie komercyjne oprogramowanie z lat 90. XX wieku wymagało dobrego skanu, najlepiej w językach zachodnioeuropejskich. W 2013 możliwe było rozpoznawanie mało dokładnych skanów, wykonanych telefonami komórkowymi z szumami na obrazkach, z tekstem napisanym pod nienaturalnymi kątami, w 120–186 językach (w zależności od programu).
rdf:langString OCR é um acrónimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bits sejam eles escaneados, escritos a mão, datilografados ou impressos. Dessa forma, através do OCR é possível obter um arquivo de texto editável por um computador. Combinado com outras tecnologias, como a inteligência artificial, empresas de diversos segmentos têm aplicado o OCR para automatizar processos de cadastro, onboarding e formalização, extraindo informações de documentos de identificação pessoal, contratos e comprovantes de residência.
rdf:langString Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные, использующиеся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко применяется для преобразования книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание символов позволяет редактировать текст, осуществлять поиск слов или фраз, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения. Системы оптического распознавания текста требуют калибровки для работы с конкретным шрифтом; в ранних версиях для программирования было необходимо изображение каждого символа, программа одновременно могла работать только с одним шрифтом. В настоящее время больше всего распространены так называемые «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Некоторые системы оптического распознавания текста способны восстанавливать исходное форматирование текста, включая изображения, колонки и другие нетекстовые компоненты.
rdf:langString Maskinläsningeller optisk teckenläsning (ofta förkortat OCR efter engelskans Optical Character Recognition) kallas datortekniken att med hjälp av bildanalys förvandla digitala bilder av tryckt text till bokstäver och siffror som andra datorprogram, till exempel ordbehandlare, kan använda. Den varierande kvaliteten på tryckt text kan göra denna texttydning svår ibland, så därför har många program för maskinläsning en inlärningsfunktion, där användaren kan hjälpa programmet att förstå hur vissa tecken ska tydas.
rdf:langString 光学字符识别(英語:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。
rdf:langString Оптичне розпізнавання тексту (англ. optical character recognition, OCR) — це механічне або електронне переведення зображень рукописного, машинописного або друкованого тексту в послідовність кодів, що використовуються для представлення в текстовому редакторі. Розпізнавання широко використовується для конвертації книг і документів в електронний вигляд, для автоматизації систем обліку в бізнесі або для публікації тексту на вебсторінці. Оптичне розпізнавання тексту дозволяє редагувати текст, здійснювати пошук слова або фрази, зберігати його в компактнішій формі, демонструвати або роздруковувати матеріал, не втрачаючи якості, аналізувати інформацію, а також застосовувати до тексту електронний переклад, форматування або перетворення в мовлення. Оптичне розпізнавання тексту є досліджуваною проблемою в галузях розпізнавання образів, штучного інтелекту і комп'ютерного зору. Системи оптичного розпізнавання тексту вимагають калібрування для роботи з конкретним шрифтом; у ранніх версіях, для програмування було необхідно зображення кожного символу, програма одночасно могла працювати тільки з одним шрифтом. Зараз найпоширеніші так звані «інтелектуальні» системи, що розпізнають більшість шрифтів із високим ступенем точності. Деякі системи оптичного розпізнавання тексту здатні відновлювати вихідне форматування тексту, включаючи зображення, колонки й інші нетекстові компоненти.
xsd:nonNegativeInteger 36132

data from the linked data cloud