Character encoding

http://dbpedia.org/resource/Character_encoding an entity of type: WikicatComputerStandards

يستخدم ترميز المحارف في الحوسبة لتمثيل الرموز بواسطة نظام ترميز، اعتمادًا على السياق ودرجة تجريد الرمز وعلى نقاط الرمز المقابل، واعتمادًا على مساحة الرمز أيضاً.... الناتج يمكن أن يكون: تسلسل ثنائي أو ثُمانيَة مثلاً [00110101], أو أعداد طبيعية أو أرقام طبيعية أو نبضات كهربائية إلخ... تشفير الرموز يستخدم في: الحوسبة، تخزين البيانات، أنتقال البيانات النصية. «مجموعة رموز», «خارطة رموز», «مجموعة أكواد», «جدول قيم الرموز», هي مصطلحات مرتبطة ببعضها البعض، ولكن ليست متطابقة تماماً. rdf:langString

La codificació de caràcters és el mètode que permet convertir un caràcter d'un llenguatge natural (alfabet o sil·labari) en un símbol d'un altre sistema de representació, com un nombre o una seqüència de polsos elèctrics en un sistema electrònic, aplicant normes o regles de codificació. rdf:langString

Μια κωδικοποίηση χαρακτήρων αποτελείταιαπό έναν κώδικα που συσχετίζειένα σύνολο όπως π.χ. οι χαρακτήρεςπου χρησιμοποιούμε σε ένα αλφάβητο με ένα διαφορετικό σύνολο π.χ. αριθμών , ή ηλεκτρικώνσημάτων, προκειμένου να διευκολυνθεί η αποθήκευση ,διαχείριση κειμένου σευπολογιστικά συστήματα καθώς και η μεταφοράκειμένου μέσω τηλεπικοινωνιακών δικτύων. Κλασικά παραδείγματα είναι ο κώδικας Μορςπου κωδικοποιεί ένα σύνολο γραμμάτων τουλατινικού αλφαβήτου σε μια σειρά από μικρές και μεγάλες παύλες,και ο κώδικας ASCII,που κωδικοποιείγράμματα,αριθμούς και άλλα σύμβολα στίξης κτλ,σαν δυαδικούς αριθμούς επτά δυαδικών ψηφίων.Π.χ. το γράμμα 'Α' κωδικοποιείται από τον κώδικαASCII στην ακολουθία 1-0-0-0-0-0-1. rdf:langString

Karaktereen kodeketa hizkuntza natural baten (alfabetoa, adibidez) bat beste sistema baten sinbolo bat bihurtzea ahalbidetzen duen metodoa da, esaterako, zenbaki bat edo, sistema elektriko batean, pultsu elektrikoen sekuentzia bat. Horretarako, kodeketa erregelak edo kodeketa arauak aplikatzen dira. Metodo hauek karaktere bat beste sistema baten sinbolo bat bihurtzeko modua zehazten dute. Honen adibideak dira Morse kodea, ASCII kodea edo kodea. rdf:langString

La codificación de caracteres es el método que permite convertir un carácter de un lenguaje natural (como el de un alfabeto o silabario) en un símbolo de otro sistema de representación, como un número o una secuencia de pulsos electrónicos en un sistema electrónico aplicando normas o reglas de codificación. Definen la forma en la que se codifica un carácter dado en un símbolo en otro sistema de representación. Ejemplos de esto son el código Morse, la norma ASCII o la UTF-8, entre otros. rdf:langString

문자 인코딩(영어: character encoding) 또는 텍스트 인코딩(text encoding) 또는 줄여서 인코딩은 사용자가 입력한 문자나 기호들을 컴퓨터가 이용할 수 있는 신호로 만드는 것을 말한다. 넓은 의미의 컴퓨터는 이러한 신호를 입력받고 처리하는 기계를 뜻하며, 을 통해 이렇게 처리된 정보를 사용자가 이해할 수 있게 된다. 이 신호를 입력하는 인코딩과 문자를 해독하는 디코딩을 하기 위해선 미리 정해진 기준을 바탕으로 입력과 해독이 처리되어야 하는데, 이를 문자열 세트 또는 문자셋이라고 한다. 초기 보급형 컴퓨터의 문자열 세트는 아스키나 EBCDIC이 표준이었으나, 이러한 문자열 세트는 세계 곳곳에 인터넷이 보급되며 표현해야 할 문자가 증가하면서 이러한 문자셋들을 표준화하기 위해 많은 대체 방식이 개발되었다. 표준 문자셋을 개발하는 것에 대한 논의가 이어졌고, 후에는 유니코드가 등장하게 되었다. rdf:langString

文字コード（もじコード）は、コンピュータ上で文字（キャラクタ）を利用する目的で各文字に割り当てられるバイト表現。もしくは、バイト表現と文字の対応関係（文字コード体系）のことを指して「文字コード」と呼ぶことも多い。本記事では主に後者について記述する。 rdf:langString

Набо́р си́мволов (англ. character set) — таблица, задающая кодировку конечного множества символов алфавита (обычно элементов текста: букв, цифр, знаков препинания). Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько символов другого алфавита (точек и тире в коде Mорзе, сигнальных флагов на флоте, нулей и единиц (битов) в компьютере). rdf:langString

字符编码（英語：Character encoding）、字集碼是把字符集中的字符编码为指定集合中某一对象（例如：比特模式、自然数序列、或者电脉冲），以便文本在计算机中存储和通过通信网络的传递。常见的例子包括将拉丁字母表编码成摩斯电码和ASCII。其中，ASCII将字母、数字和其它符号編號，並用7位元的二进制來表示这个整数。通常會額外使用一个扩充的位元，以便于以1个字节的方式存储。在计算机技术发展的早期，如ASCII（1963年）和EBCDIC（1964年）这样的字符集逐漸成為標準。但这些字符集的局限很快就变得明显，于是人们开发了許多方法来扩展它们。对于支持包括东亚CJK字符家族在内的写作系统的要求能支持更大量的字符，并且需要一种系统而不是临时的方法实现这些字符的编码。 rdf:langString

Kódování znaků nebo znakový kód (anglicky character encoding, character code) je ve výpočetní technice kód, který každému znaku přiřazuje určité číslo (bajt, sekvenci elektrických pulzů ap.). Znaková sada označuje množinu všech znaků zvoleného kódování, které jsou uspořádány podle kódových bodů, tedy pozic v tabulce znaků seřazených podle kódů. Znakem se rozumí písmena různých abeced, číslice, symboly a jiné grafémy, ale také nezobrazované řídící znaky, které mají zvláštní funkce. rdf:langString

Character encoding is the process of assigning numbers to graphical characters, especially the written characters of human language, allowing them to be stored, transmitted, and transformed using digital computers. The numerical values that make up a character encoding are known as "code points" and collectively comprise a "code space", a "code page", or a "character map". rdf:langString

Kodoprezento estas maniero plukodi datumon, koditan per iu kodo, uzante alian kodon, pli konvenan por datumtransmeto aŭ alia celo. Rezulte la datumo estas kodita per kompono de kodoj. Ekz-e oni ofte uzas UTF-8 por transmeti aŭ konservi tekstojn koditajn en Unikodo: Simile la egalsigna askiigo estas kodoprezento ebliganta prezenti 8-bitajn kodojn per printeblaj 7-bitaj bajtoj;la 64-uma kodoprezento ebligas prezenti duumajn datumojn per 64 printeblaj «ciferoj» askiaj. rdf:langString

Eine Zeichenkodierung (englisch Character encoding, kurz Encoding) erlaubt die eindeutige Zuordnung von Schriftzeichen (i. A. Buchstaben oder Ziffern) und Symbolen innerhalb eines Zeichensatzes. In der elektronischen Datenverarbeitung werden Zeichen über einen Zahlenwert kodiert, um sie zu übertragen oder zu speichern. Der deutsche Umlaut Ü wird zum Beispiel im ISO-8859-1-Zeichensatz mit dem Dezimalwert 220 kodiert. Im EBCDIC-Zeichensatz kodiert derselbe Wert 220 die geschweifte Klammer }. Zur richtigen Darstellung eines Zeichens muss also die Zeichenkodierung bekannt sein; der Zahlenwert allein reicht nicht aus. rdf:langString

Pengodean karakter (bahasa Inggris: character encoding) atau penyandiaksaraan, kadang disebut set karakter, terdiri dari sandi atau kode yang memasangkan serangkaian aksara berurutan dari suatu kumpulan dengan sesuatu yang lain, seperti urutan bilangan asli (natural numbers), perlapanan (octet) atau denyut listrik, untuk mempermudah penyimpanan naskah pada komputer dan pengalirhantaran naskah melalui jaringan telekomunikasi. Misalnya sandi Morse, yang menyandikan huruf alfabet Latin ke dalam rangkaian tekanan panjang dan pendek dari kunci telegraf; serta ASCII, yang menyandikan huruf, bilangan, dan simbol-simbol lain, sebagai bilangan bulat dan versi perduaan (binary) 7-bita dari bilangan bulat tersebut; umumnya ditambahkan nol-bita untuk mempermudah penyimpanan dalam bita perlapanan. rdf:langString

En télécommunications et en informatique, un jeu de caractères codés est un code qui associe un jeu de caractères abstraits d’un ou plusieurs systèmes d’écriture (comme des alphabets ou des syllabaires) utilisés pour transcrire des langues naturelles avec une représentation numérique pour chaque caractère de ce jeu, ce nombre pouvant lui-même avoir des représentations numériques différentes. Par exemple, le code Morse (qui associe l’alphabet latin à une série de pressions longues et de pressions courtes sur le manipulateur morse du télégraphe) et le code ASCII (qui code les lettres, les chiffres et d'autres symboles comme des entiers codés sur 7 bits) sont des jeux de caractères codés. rdf:langString

Una codifica di caratteri, o charset, consiste in un codice che associa un insieme di caratteri (tipicamente rappresentazioni di grafemi così come appaiono in un alfabeto utilizzato per comunicare in una lingua naturale) ad un insieme di altri oggetti, come numeri (specialmente nell'informatica) o , con lo scopo di facilitare la di un testo in un computer o la sua trasmissione attraverso una rete di telecomunicazioni. Esempi comuni sono il Codice Morse e la codifica ASCII. rdf:langString

Tekencodering is de koppeling van uit een bepaalde tekenset aan een code. Deze koppeling en de weergave daarvan worden ook wel een codetabel genoemd. De code kan bestaan uit natuurlijke getallen of morse, maar ook uit binaire getallen (of elektrische signalen) en wordt daarom veel gebruikt voor de opslag van tekens op computers en andere apparaten. Bij morse worden tekens uit het Latijns alfabet (letters) omgezet naar een serie korte en lange signalen die gebruikt kunnen worden bij een telegraaf. In computers bepaalt de tekencodering hoe de tekens (waaronder letters, cijfers, leestekens en spaties, maar ook enkele stuurcodes zoals tab, carriage return en line feed) die in platte tekst kunnen voorkomen, worden gerepresenteerd in bytes. rdf:langString

Zestaw znaków – zestawienie znaków pisma z odpowiadającymi im kodami binarnymi lub liczbowymi. Tabelę taką można następnie wykorzystać do przekształcenia tekstu na postać cyfrową, w szczególności w komputerze. rdf:langString

En teckenkod (engelska character encoding) är ett sätt att representera, koda, en vald uppsättning tecken, med till exempel elektriska pulser eller tal. Detta används när man vill lagra eller överföra text på något tekniskt sätt, inte vanliga skrivtecken. Ett tidigt exempel är Morsealfabetet, där tecknen representeras av långa och korta pulser. Numera menar man med teckenkodning oftast någon form av binär digital kodning som används vid kommunikation och datalagring i datorer. De flesta teckenkodningar som används, och har använts, är avsedda att användas i datasystem. Undantaget är Morse-kodningar, som inte lämpar sig så väl för detta ändamål. rdf:langString

Uma codificação de caracteres é um padrão de relacionamento entre um conjunto de caracteres (representações de grafemas ou unidades similares a grafemas como as que compõem um alfabeto ou silabário utilizados na comunicação através de uma linguagem natural) com um conjunto de outra coisa, como por exemplo números ou pulsos elétricos com o objetivo de facilitar o armazenamento de texto em computadores e sua transmissão através de redes de telecomunicação. Exemplos comuns são o código Morse que codifica as letras do alfabeto latino e os numerais como seqüências de pulsos elétricos de longa e curta duração e também o ASCII que codifica os mesmos grafemas do código Morse além de outros símbolos através de números inteiros e da representação binária em sete bits destes mesmos números. rdf:langString

Набі́р си́мволів, кодува́ння си́мволів, табли́ця си́мволів (англ. character set, character encoding) — певна таблиця кодування скінченної множини символів. Така таблиця зіставляє кожному символу послідовність довжиною в один або більше байт. Нерідко замість терміна набір символів неправильно вживають термін кодова сторінка, що означає насправді окремий випадок набору символів з однобайтовим кодуванням. Термін кодування (в комп'ютерному контексті) є синонімом терміна «набір символів». У Вікіпедії й інших проектах фонду Вікімедія використовується Юнікод (UTF-8). rdf:langString

rdfs:label

rdf:langString Character encoding

rdf:langString ترميز المحارف

rdf:langString Codificació de caràcters

rdf:langString Kódování znaků

rdf:langString Zeichenkodierung

rdf:langString Κωδικοποίηση χαρακτήρων

rdf:langString Kodoprezento

rdf:langString Codificación de caracteres

rdf:langString Karaktereen kodeketa

rdf:langString Pengodean karakter

rdf:langString Codifica di caratteri

rdf:langString Codage des caractères

rdf:langString 문자 인코딩

rdf:langString 文字コード

rdf:langString Tekencodering

rdf:langString Zestaw znaków

rdf:langString Codificação de caracteres

rdf:langString Набор символов

rdf:langString Teckenkod

rdf:langString Кодування символів

rdf:langString 字符编码

dbpedia-owl:wikiPageID

xsd:integer 5295

dbpedia-owl:wikiPageRevisionID

xsd:integer 1120157100

dbpedia-owl:abstract

rdf:langString يستخدم ترميز المحارف في الحوسبة لتمثيل الرموز بواسطة نظام ترميز، اعتمادًا على السياق ودرجة تجريد الرمز وعلى نقاط الرمز المقابل، واعتمادًا على مساحة الرمز أيضاً.... الناتج يمكن أن يكون: تسلسل ثنائي أو ثُمانيَة مثلاً [00110101], أو أعداد طبيعية أو أرقام طبيعية أو نبضات كهربائية إلخ... تشفير الرموز يستخدم في: الحوسبة، تخزين البيانات، أنتقال البيانات النصية. «مجموعة رموز», «خارطة رموز», «مجموعة أكواد», «جدول قيم الرموز», هي مصطلحات مرتبطة ببعضها البعض، ولكن ليست متطابقة تماماً.

rdf:langString La codificació de caràcters és el mètode que permet convertir un caràcter d'un llenguatge natural (alfabet o sil·labari) en un símbol d'un altre sistema de representació, com un nombre o una seqüència de polsos elèctrics en un sistema electrònic, aplicant normes o regles de codificació.

rdf:langString Kódování znaků nebo znakový kód (anglicky character encoding, character code) je ve výpočetní technice kód, který každému znaku přiřazuje určité číslo (bajt, sekvenci elektrických pulzů ap.). Znaková sada označuje množinu všech znaků zvoleného kódování, které jsou uspořádány podle kódových bodů, tedy pozic v tabulce znaků seřazených podle kódů. Znakem se rozumí písmena různých abeced, číslice, symboly a jiné grafémy, ale také nezobrazované řídící znaky, které mají zvláštní funkce. Znaková sada je obdobou Morseovy abecedy, která kóduje písmena latinky (a další znaky) pomocí sérií dlouhých a krátkých stisků telegrafního klíče. Proces standardizace začal znakové sady ASCII roku 1963, která písmena americké abecedy s číslicemi a základními symboly kóduje pomocí 7bitového čísla. Kód všech používaných znaků zahrnuje standard Unicode využívaný i moderním kódováním UTF-8.

rdf:langString Μια κωδικοποίηση χαρακτήρων αποτελείταιαπό έναν κώδικα που συσχετίζειένα σύνολο όπως π.χ. οι χαρακτήρεςπου χρησιμοποιούμε σε ένα αλφάβητο με ένα διαφορετικό σύνολο π.χ. αριθμών , ή ηλεκτρικώνσημάτων, προκειμένου να διευκολυνθεί η αποθήκευση ,διαχείριση κειμένου σευπολογιστικά συστήματα καθώς και η μεταφοράκειμένου μέσω τηλεπικοινωνιακών δικτύων. Κλασικά παραδείγματα είναι ο κώδικας Μορςπου κωδικοποιεί ένα σύνολο γραμμάτων τουλατινικού αλφαβήτου σε μια σειρά από μικρές και μεγάλες παύλες,και ο κώδικας ASCII,που κωδικοποιείγράμματα,αριθμούς και άλλα σύμβολα στίξης κτλ,σαν δυαδικούς αριθμούς επτά δυαδικών ψηφίων.Π.χ. το γράμμα 'Α' κωδικοποιείται από τον κώδικαASCII στην ακολουθία 1-0-0-0-0-0-1.

rdf:langString Eine Zeichenkodierung (englisch Character encoding, kurz Encoding) erlaubt die eindeutige Zuordnung von Schriftzeichen (i. A. Buchstaben oder Ziffern) und Symbolen innerhalb eines Zeichensatzes. In der elektronischen Datenverarbeitung werden Zeichen über einen Zahlenwert kodiert, um sie zu übertragen oder zu speichern. Der deutsche Umlaut Ü wird zum Beispiel im ISO-8859-1-Zeichensatz mit dem Dezimalwert 220 kodiert. Im EBCDIC-Zeichensatz kodiert derselbe Wert 220 die geschweifte Klammer }. Zur richtigen Darstellung eines Zeichens muss also die Zeichenkodierung bekannt sein; der Zahlenwert allein reicht nicht aus. Zahlenwerte aus Zeichenkodierungen lassen sich auf verschiedene Art speichern oder übertragen, z. B. als Morsezeichen, verschieden hohe Töne (Faxgerät), verschieden hohe Spannungen. Binäre Systeme hatten seit jeher eine besondere Bedeutung, da mit steigender Anzahl der Basiselemente des Codes die Gefahr von Verwechslungen steigt. In älterer Fachliteratur wird mitunter auch gleichbedeutend der Begriff Zeichenverschlüsselung verwendet, wenn den Zeichen (Schlüssel-)Nummern zugeordnet werden; aufgrund der möglichen fälschlichen Zuordnung in den Bereich der Kryptographie wird diese Bezeichnung heute kaum noch verwendet.

rdf:langString Kodoprezento estas maniero plukodi datumon, koditan per iu kodo, uzante alian kodon, pli konvenan por datumtransmeto aŭ alia celo. Rezulte la datumo estas kodita per kompono de kodoj. Ekz-e oni ofte uzas UTF-8 por transmeti aŭ konservi tekstojn koditajn en Unikodo: Ĉi tie Unikodo ĵetas signojn en pozitivajn entjerojn; sed por oportunigi la datumtransmeton kaj tekstotraktadon, oni prezentas tiujn entjerojn per unu aŭ pluraj bajtoj. Interalie, ĉiuj signoj de Askio (kia 'a' en la tabelo) estas prezentataj per 1 bajto kies valoro egalas al kodnumero de la signo; sed la ĉapelitaj literoj de Esperanto havas kodnumerojn pli grandajn ol 127 — kaj eĉ pli grandajn ol 256 — kaj ne estas prezenteblaj per 1 bajto; UTF-8 disponigas algoritmon por prezenti iliajn valorojn per 2 bajtoj. Tamen pli grandaj kodnumeroj povas postuli 3 aŭ eĉ 4 bajtojn. Simile la egalsigna askiigo estas kodoprezento ebliganta prezenti 8-bitajn kodojn per printeblaj 7-bitaj bajtoj;la 64-uma kodoprezento ebligas prezenti duumajn datumojn per 64 printeblaj «ciferoj» askiaj.

rdf:langString Character encoding is the process of assigning numbers to graphical characters, especially the written characters of human language, allowing them to be stored, transmitted, and transformed using digital computers. The numerical values that make up a character encoding are known as "code points" and collectively comprise a "code space", a "code page", or a "character map". Early character codes associated with the optical or electrical telegraph could only represent a subset of the characters used in written languages, sometimes restricted to upper case letters, numerals and some punctuation only. The low cost of digital representation of data in modern computer systems allows more elaborate character codes (such as Unicode) which represent most of the characters used in many written languages. Character encoding using internationally accepted standards permits worldwide interchange of text in electronic form.

rdf:langString Karaktereen kodeketa hizkuntza natural baten (alfabetoa, adibidez) bat beste sistema baten sinbolo bat bihurtzea ahalbidetzen duen metodoa da, esaterako, zenbaki bat edo, sistema elektriko batean, pultsu elektrikoen sekuentzia bat. Horretarako, kodeketa erregelak edo kodeketa arauak aplikatzen dira. Metodo hauek karaktere bat beste sistema baten sinbolo bat bihurtzeko modua zehazten dute. Honen adibideak dira Morse kodea, ASCII kodea edo kodea.

rdf:langString La codificación de caracteres es el método que permite convertir un carácter de un lenguaje natural (como el de un alfabeto o silabario) en un símbolo de otro sistema de representación, como un número o una secuencia de pulsos electrónicos en un sistema electrónico aplicando normas o reglas de codificación. Definen la forma en la que se codifica un carácter dado en un símbolo en otro sistema de representación. Ejemplos de esto son el código Morse, la norma ASCII o la UTF-8, entre otros.

rdf:langString Pengodean karakter (bahasa Inggris: character encoding) atau penyandiaksaraan, kadang disebut set karakter, terdiri dari sandi atau kode yang memasangkan serangkaian aksara berurutan dari suatu kumpulan dengan sesuatu yang lain, seperti urutan bilangan asli (natural numbers), perlapanan (octet) atau denyut listrik, untuk mempermudah penyimpanan naskah pada komputer dan pengalirhantaran naskah melalui jaringan telekomunikasi. Misalnya sandi Morse, yang menyandikan huruf alfabet Latin ke dalam rangkaian tekanan panjang dan pendek dari kunci telegraf; serta ASCII, yang menyandikan huruf, bilangan, dan simbol-simbol lain, sebagai bilangan bulat dan versi perduaan (binary) 7-bita dari bilangan bulat tersebut; umumnya ditambahkan nol-bita untuk mempermudah penyimpanan dalam bita perlapanan. Pada masa-masa awal komputer, pengenalan penyandiaksaraan seperti ASCII (1963) dan EBCDIC (1964) mengawali proses pembakuan. Keterbatasan kumpulan tersebut mulai tampak, dan beberapa metode seterjadinya (ad hoc) dikembangkan untuk memperluaskannya. Kebutuhan untuk mendukung berbagai macam tata tulisan, termasuk rumpun aksara CJK dari tulisan Asia Timur, membutuhkan dukungan untuk jauh lebih banyak aksara dan menuntut pendekatan yang tersusun rapi untuk penyandiaksaraan, dan bukan pendekatan seterjadinya seperti sebelumnya.

rdf:langString En télécommunications et en informatique, un jeu de caractères codés est un code qui associe un jeu de caractères abstraits d’un ou plusieurs systèmes d’écriture (comme des alphabets ou des syllabaires) utilisés pour transcrire des langues naturelles avec une représentation numérique pour chaque caractère de ce jeu, ce nombre pouvant lui-même avoir des représentations numériques différentes. Par exemple, le code Morse (qui associe l’alphabet latin à une série de pressions longues et de pressions courtes sur le manipulateur morse du télégraphe) et le code ASCII (qui code les lettres, les chiffres et d'autres symboles comme des entiers codés sur 7 bits) sont des jeux de caractères codés. Il est indispensable, pour l'échange d'information sur l'Internet, par exemple, de préciser le codage utilisé. Ne pas le faire peut rendre un document difficilement lisible (remplacement des lettres accentuées par d'autres suites de caractères connu sous le nom de mojibake). Toutefois, la convergence vers un standard commun devrait enfin répondre à ce problème. Dans certains contextes (en particulier dans les communications et dans l'utilisation de données informatiques), il est important de distinguer un répertoire de caractères, qui est un jeu complet de caractères abstraits qu'un système supporte, et un jeu de caractères codés ou codage de caractères qui spécifie comment représenter un caractère en utilisant un entier.

rdf:langString 문자 인코딩(영어: character encoding) 또는 텍스트 인코딩(text encoding) 또는 줄여서 인코딩은 사용자가 입력한 문자나 기호들을 컴퓨터가 이용할 수 있는 신호로 만드는 것을 말한다. 넓은 의미의 컴퓨터는 이러한 신호를 입력받고 처리하는 기계를 뜻하며, 을 통해 이렇게 처리된 정보를 사용자가 이해할 수 있게 된다. 이 신호를 입력하는 인코딩과 문자를 해독하는 디코딩을 하기 위해선 미리 정해진 기준을 바탕으로 입력과 해독이 처리되어야 하는데, 이를 문자열 세트 또는 문자셋이라고 한다. 초기 보급형 컴퓨터의 문자열 세트는 아스키나 EBCDIC이 표준이었으나, 이러한 문자열 세트는 세계 곳곳에 인터넷이 보급되며 표현해야 할 문자가 증가하면서 이러한 문자셋들을 표준화하기 위해 많은 대체 방식이 개발되었다. 표준 문자셋을 개발하는 것에 대한 논의가 이어졌고, 후에는 유니코드가 등장하게 되었다.

rdf:langString 文字コード（もじコード）は、コンピュータ上で文字（キャラクタ）を利用する目的で各文字に割り当てられるバイト表現。もしくは、バイト表現と文字の対応関係（文字コード体系）のことを指して「文字コード」と呼ぶことも多い。本記事では主に後者について記述する。

rdf:langString Tekencodering is de koppeling van uit een bepaalde tekenset aan een code. Deze koppeling en de weergave daarvan worden ook wel een codetabel genoemd. De code kan bestaan uit natuurlijke getallen of morse, maar ook uit binaire getallen (of elektrische signalen) en wordt daarom veel gebruikt voor de opslag van tekens op computers en andere apparaten. Bij morse worden tekens uit het Latijns alfabet (letters) omgezet naar een serie korte en lange signalen die gebruikt kunnen worden bij een telegraaf. In computers bepaalt de tekencodering hoe de tekens (waaronder letters, cijfers, leestekens en spaties, maar ook enkele stuurcodes zoals tab, carriage return en line feed) die in platte tekst kunnen voorkomen, worden gerepresenteerd in bytes. De precieze werking van de stuurcodes valt niet onder tekencodering. Met name geldt dit ook voor de vraag of carriage return, line feed of de combinatie daarvan wordt gebruikt als nieuweregelteken. In de begindagen van computers en de invoering van tekensets zoals ASCII in 1963 en EBCDIC in 1964 werd begonnen met het proces van standaardiseren van tekencodering. Toen de beperkingen van deze sets al snel duidelijk bleken, werden er een aantal ad-hocmethodes uitgevonden om deze uit te breiden. Ook bleek de ondersteuning voor andere tekens en talen nodig, een voorbeeld hiervan zijn de CJK-systemen voor Chinese, Japanse en Koreaanse tekens. Hiervoor was door het grote aantal tekens een systematische aanpak nodig voor de tekencodering in tegenstelling tot de eerdere ad-hocmethodes.

rdf:langString Zestaw znaków – zestawienie znaków pisma z odpowiadającymi im kodami binarnymi lub liczbowymi. Tabelę taką można następnie wykorzystać do przekształcenia tekstu na postać cyfrową, w szczególności w komputerze. Historycznie istniało wiele różnych zestawów znaków. Większość z nich określała również odpowiednie kody liczbowe. Wszystkie jednak były ograniczone, najczęściej do znaków jednego (lub kilku pokrewnych) języków, lub też były zbyt nieporęczne, by można ich było łatwo używać. Obecnie powszechny we wszystkich nowoczesnych aplikacjach i systemach operacyjnych jest międzynarodowy standard Unicode (najczęściej w połączeniu z kodowaniem UTF-8), zdolny przedstawić każdy znak ze wszystkich pism świata.

rdf:langString Una codifica di caratteri, o charset, consiste in un codice che associa un insieme di caratteri (tipicamente rappresentazioni di grafemi così come appaiono in un alfabeto utilizzato per comunicare in una lingua naturale) ad un insieme di altri oggetti, come numeri (specialmente nell'informatica) o , con lo scopo di facilitare la di un testo in un computer o la sua trasmissione attraverso una rete di telecomunicazioni. Esempi comuni sono il Codice Morse e la codifica ASCII. A seconda del livello di astrazione e del contesto, i punti di codice corrispondenti e lo spazio di codice risultante possono essere considerati come modelli di bit, ottetti, numeri naturali, impulsi elettrici, ecc. Una codifica dei caratteri viene utilizzata nel calcolo, nell'archiviazione dei dati e nella trasmissione di dati testuali. "Set di caratteri", "mappa di caratteri", "set di codici" e "code page" sono termini correlati, ma non identici. I primi codici di caratteri associati al telegrafo ottico o elettrico potevano rappresentare solo un sottoinsieme dei caratteri usati nelle lingue scritte, a volte limitati a lettere maiuscole, numeri e solo alcuni segni di punteggiatura. Il basso costo della rappresentazione digitale dei dati nei moderni sistemi informatici consente codici di caratteri più elaborati (come Unicode) che rappresentano la maggior parte dei caratteri utilizzati in molte lingue scritte. La codifica dei caratteri utilizzando standard accettati a livello internazionale consente lo scambio di testo in formato elettronico a livello mondiale.

rdf:langString Набо́р си́мволов (англ. character set) — таблица, задающая кодировку конечного множества символов алфавита (обычно элементов текста: букв, цифр, знаков препинания). Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько символов другого алфавита (точек и тире в коде Mорзе, сигнальных флагов на флоте, нулей и единиц (битов) в компьютере).

rdf:langString En teckenkod (engelska character encoding) är ett sätt att representera, koda, en vald uppsättning tecken, med till exempel elektriska pulser eller tal. Detta används när man vill lagra eller överföra text på något tekniskt sätt, inte vanliga skrivtecken. Ett tidigt exempel är Morsealfabetet, där tecknen representeras av långa och korta pulser. Numera menar man med teckenkodning oftast någon form av binär digital kodning som används vid kommunikation och datalagring i datorer. De flesta teckenkodningar som används, och har använts, är avsedda att användas i datasystem. Undantaget är Morse-kodningar, som inte lämpar sig så väl för detta ändamål. Alla datorsystemtillverkare har gjort sina egna teckenkodningar, till exempel IBM med sin serie EBCDIC-baserade teckenkodningar. En tidig amerikansk standard som fick spridning hos många datorsystemtillverkare var ASCII. De flesta teckenkodningar som definierats är baserade på ASCII, till exempel Microsoft med sin serie teckenkodningar för MS-DOS, senare för Windows, och Apple med sin serie teckenkodningar för MacOS. Även ISO och många nationella standardiseringsorgan har definierat ASCII-baserade teckenkodningar, till exempel ISO/IEC 8859-serien och (som egentligen är en sammanställning av ett flertal japanska teckenstandarder), varav många används främst i Unix/Linux. Datautbyte och kommunikation mellan datorer kan kräva konverteringar mellan olika teckenkodningar. Detta leder till svårigheter, då teckenuppsättningen inte är densamma mellan de olika kodningarna, särskilt för andra språk än engelska. Ett annat problem är att en kodning i allmänhet har stöd bara för ett eller några skriftsystem, varvid flerspråkiga dokument är svårhanterliga. För att råda bot på detta, började både ISO och ett konsortium av datorsystemtillverkare var för sig att definiera en "universell" teckenkodning. Arbetet dem emellan är numera synkroniserat, så att man inte har två "universella" teckenkodningar, utan en. ISO har utarbetat ISO/IEC 10646, som är synkroniserat med Unicodekonsortiets Unicode vad gäller teckenuppsättning och kodningar.

rdf:langString Uma codificação de caracteres é um padrão de relacionamento entre um conjunto de caracteres (representações de grafemas ou unidades similares a grafemas como as que compõem um alfabeto ou silabário utilizados na comunicação através de uma linguagem natural) com um conjunto de outra coisa, como por exemplo números ou pulsos elétricos com o objetivo de facilitar o armazenamento de texto em computadores e sua transmissão através de redes de telecomunicação. Exemplos comuns são o código Morse que codifica as letras do alfabeto latino e os numerais como seqüências de pulsos elétricos de longa e curta duração e também o ASCII que codifica os mesmos grafemas do código Morse além de outros símbolos através de números inteiros e da representação binária em sete bits destes mesmos números. Convencionalmente, conjunto de caracteres e codificação de caracteres eram considerados sinônimos, já que o mesmo nome poderia especificar tanto quais caracteres estão disponíveis e como eles foram codificados em um fluxo de unidades de código (normalmente com um único caractere por unidade de código). No entanto, o Unicode afastou essa ideia, separando a ideia de numerar uma série de caracteres de codificar esses caracteres em um fluxo de unidades de código. Para manter as nomenclaturas históricas e os sistemas baseados nelas, usa-se o termo charset para se referir a uma codificação de caracteres.

rdf:langString Набі́р си́мволів, кодува́ння си́мволів, табли́ця си́мволів (англ. character set, character encoding) — певна таблиця кодування скінченної множини символів. Така таблиця зіставляє кожному символу послідовність довжиною в один або більше байт. Нерідко замість терміна набір символів неправильно вживають термін кодова сторінка, що означає насправді окремий випадок набору символів з однобайтовим кодуванням. Термін кодування (в комп'ютерному контексті) є синонімом терміна «набір символів». Зараз в основному використовуються кодування двох типів: сумісні з ASCII і сумісні з EBCDIC. Переважна більшість кодувань, в тому числі UTF-8 Юнікода, — сумісні з ASCII. Кодування на базі EBCDIC (наприклад, ЄС ЕОМ ) використовуються тільки на деяких мейнфреймах. Спочатку в кожній операційній системі використовувався один набір символів. Тепер використовувані набори символів стандартизовані та залежать від типу операційної системи лише за традицією й установлюються відповідно до локалі. У Вікіпедії й інших проектах фонду Вікімедія використовується Юнікод (UTF-8).

rdf:langString 字符编码（英語：Character encoding）、字集碼是把字符集中的字符编码为指定集合中某一对象（例如：比特模式、自然数序列、或者电脉冲），以便文本在计算机中存储和通过通信网络的传递。常见的例子包括将拉丁字母表编码成摩斯电码和ASCII。其中，ASCII将字母、数字和其它符号編號，並用7位元的二进制來表示这个整数。通常會額外使用一个扩充的位元，以便于以1个字节的方式存储。在计算机技术发展的早期，如ASCII（1963年）和EBCDIC（1964年）这样的字符集逐漸成為標準。但这些字符集的局限很快就变得明显，于是人们开发了許多方法来扩展它们。对于支持包括东亚CJK字符家族在内的写作系统的要求能支持更大量的字符，并且需要一种系统而不是临时的方法实现这些字符的编码。

dbpedia-owl:wikiPageLength

xsd:nonNegativeInteger 33849

rdf:type

yago:WikicatComputerStandards

yago:Abstraction100002137

yago:Measure100033615

yago:Standard107260623

yago:SystemOfMeasurement113577171

foaf:depiction

<http://commons.wikimedia.org/wiki/Special:FilePath/Blue-punch-card-front-horiz.png>

<http://commons.wikimedia.org/wiki/Special:FilePath/KB_Dubeolsik_for_Old_Hangul_(NG3).svg>

<http://commons.wikimedia.org/wiki/Special:FilePath/Papertape-Wikipedia-example-dark1-2000px.png>