Record linkage
http://dbpedia.org/resource/Record_linkage
ربط السجلات (المعروف أيضًا باسم مطابقة البيانات، ودقة الكيان، والعديد من المصطلحات الأخرى) هي مهمة البحث عن السجلات في مجموعة البيانات التي تشير إلى نفس الكيان عبر مصادر بيانات مختلفة (على سبيل المثال ملفات البيانات والكتب ومواقع الويب وقواعد البيانات). يعد ربط السجل ضروريًا عند الانضمام إلى مجموعات بيانات مختلفة استنادًا إلى الكيانات التي قد تشترك أو لا تشترك في معرّف مشترك (على سبيل المثال، مفتاح قاعدة البيانات أو معرف الموارد الموحد أو رقم التعريف الوطني)، والذي قد يكون بسبب الاختلافات في شكل السجل أو موقع التخزين أو نمط المنسق أو التفضيل. قد يُشار إلى مجموعة البيانات التي خضعت للتسوية الموجهة RL على أنها مترابطة. يشار إلى ربط السجل بربط البيانات في العديد من الولايات القضائية، ولكن كلاهما لهما نفس العملية.
rdf:langString
Datenlinkage bezeichnet die Verknüpfung verschiedener Datenquellen. Der Begriff Record Linkage wird oft synonym verwendet, oft aber auch im engeren Sinne zur Bezeichnung der technischen (algorithmischen) Verfahren zur Erkennung, ob zwei Datensätze zum selben Fall gehören, und gegebenenfalls zu deren Zusammenführung in einem einzelnen Datensatz. Datenlinkage ist Teil des Datenmanagements, dient zur Verbesserung der Datenqualität und stellt ein wichtiges Teilgebiet der Data Science dar.
rdf:langString
Record linkage (also known as data matching, data linkage, entity resolution, and many other terms) is the task of finding records in a data set that refer to the same entity across different data sources (e.g., data files, books, websites, and databases). Record linkage is necessary when joining different data sets based on entities that may or may not share a common identifier (e.g., database key, URI, National identification number), which may be due to differences in record shape, storage location, or curator style or preference. A data set that has undergone RL-oriented reconciliation may be referred to as being cross-linked.
rdf:langString
In de informatica is datamatching een procedure om twee sets data met elkaar te vergelijken. De procedure voert dan een sequentiële analyse uit van elk individueel deel van de data, en koppelt dit aan een individueel deel van de andere dataset. Datamatching kan plaatsvinden om dubbele inhoud te verwijderen of voor verschillende soorten datamining. Een speciale zaak van datamatching is duplicaatdetectie. Vele pogingen van datamatching worden gedaan met het oog op het identificeren van een belangrijke schakel tussen de twee datasets voor onder andere marketing en veiligheid.
rdf:langString
Unter Duplikaterkennung oder Objektidentifizierung (auch englisch Record Linkage) versteht man verschiedene automatische Verfahren, mit denen sich in Datensätzen Fälle identifizieren lassen, die dasselbe Objekt in der realen Welt repräsentieren. Dies ist beispielsweise beim Zusammenführen mehrerer Datenquellen (Deduplikation) oder bei der Datenbereinigung notwendig.
rdf:langString
El enlace de registro o vinculación de registro (también conocido como cotejo de datos, resolución de entidad, y muchos otros términos) es la tarea de encontrar registros en un conjunto de datos que se refieren a la misma entidad en diferentes fuentes de datos (p. ej., archivos de dato, libros, sitios web, y bases de datos). La vinculación de registro es necesario cuando se unen diferentes conjuntos de datos basados en entidades que pueden o no puede compartir un identificador común (p. ej., clave de base de datos, URI, número de identificación Nacional), lo que puede deberse a diferencias en la forma del registro, la ubicación de almacenamiento, o el estilo de conservación o preferencia. Un conjunto de datos que se ha sometido a una reconciliación RL-orientada puede denominarse entrecruza
rdf:langString
rdf:langString
ربط السجلات
rdf:langString
Duplikaterkennung
rdf:langString
Datenlinkage
rdf:langString
Enlace de registro
rdf:langString
Record linkage
rdf:langString
Datamatching
xsd:integer
978951
xsd:integer
1121646276
rdf:langString
ربط السجلات (المعروف أيضًا باسم مطابقة البيانات، ودقة الكيان، والعديد من المصطلحات الأخرى) هي مهمة البحث عن السجلات في مجموعة البيانات التي تشير إلى نفس الكيان عبر مصادر بيانات مختلفة (على سبيل المثال ملفات البيانات والكتب ومواقع الويب وقواعد البيانات). يعد ربط السجل ضروريًا عند الانضمام إلى مجموعات بيانات مختلفة استنادًا إلى الكيانات التي قد تشترك أو لا تشترك في معرّف مشترك (على سبيل المثال، مفتاح قاعدة البيانات أو معرف الموارد الموحد أو رقم التعريف الوطني)، والذي قد يكون بسبب الاختلافات في شكل السجل أو موقع التخزين أو نمط المنسق أو التفضيل. قد يُشار إلى مجموعة البيانات التي خضعت للتسوية الموجهة RL على أنها مترابطة. يشار إلى ربط السجل بربط البيانات في العديد من الولايات القضائية، ولكن كلاهما لهما نفس العملية.
rdf:langString
Unter Duplikaterkennung oder Objektidentifizierung (auch englisch Record Linkage) versteht man verschiedene automatische Verfahren, mit denen sich in Datensätzen Fälle identifizieren lassen, die dasselbe Objekt in der realen Welt repräsentieren. Dies ist beispielsweise beim Zusammenführen mehrerer Datenquellen (Deduplikation) oder bei der Datenbereinigung notwendig. Duplikate können beispielsweise durch Eingabe- und Übertragungsfehler, wegen verschiedener Schreibweisen und Abkürzungen oder aufgrund unterschiedlicher Datenschemata entstehen. Beispielsweise können in eine Adressdatenbank aus unterschiedlichen Quellen Anschriften aufgenommen werden, wobei ein und dieselbe Adresse einer Person mit Variationen mehrfach aufgenommen werden kann. Mittels Duplikaterkennung sollen nun diese Duplikate herausgefunden und die eigentlichen Adressaten als Objekte identifiziert werden. Es sind zwei Arten von Duplikaten zu unterscheiden: identische Duplikate, bei denen alle Werte identisch sind, und nichtidentische Duplikate, bei denen sich ein bis mehrere Werte unterscheiden. Die Erkennung und Bereinigung ist im ersten Fall trivial, die überzähligen Duplikate können ohne Informationsverlust einfach gelöscht werden. Schwieriger und komplexer kann der zweite Fall sein, da die Duplikate nicht über einen einfachen Ist-Gleich-Vergleich wie im ersten Fall identifiziert werden können. Aus diesem Grund müssen Heuristiken angewandt werden. Im zweiten Fall können die überzähligen Datensätze nicht einfach gelöscht werden, sie müssen vorher konsolidiert und die Werte zusammengefasst werden.
rdf:langString
Datenlinkage bezeichnet die Verknüpfung verschiedener Datenquellen. Der Begriff Record Linkage wird oft synonym verwendet, oft aber auch im engeren Sinne zur Bezeichnung der technischen (algorithmischen) Verfahren zur Erkennung, ob zwei Datensätze zum selben Fall gehören, und gegebenenfalls zu deren Zusammenführung in einem einzelnen Datensatz. Datenlinkage ist Teil des Datenmanagements, dient zur Verbesserung der Datenqualität und stellt ein wichtiges Teilgebiet der Data Science dar.
rdf:langString
El enlace de registro o vinculación de registro (también conocido como cotejo de datos, resolución de entidad, y muchos otros términos) es la tarea de encontrar registros en un conjunto de datos que se refieren a la misma entidad en diferentes fuentes de datos (p. ej., archivos de dato, libros, sitios web, y bases de datos). La vinculación de registro es necesario cuando se unen diferentes conjuntos de datos basados en entidades que pueden o no puede compartir un identificador común (p. ej., clave de base de datos, URI, número de identificación Nacional), lo que puede deberse a diferencias en la forma del registro, la ubicación de almacenamiento, o el estilo de conservación o preferencia. Un conjunto de datos que se ha sometido a una reconciliación RL-orientada puede denominarse entrecruzado. La vinculación de registro se conoce también como vinculación de datos en muchas jurisdicciones, pero los dos son el mismo proceso.
rdf:langString
Record linkage (also known as data matching, data linkage, entity resolution, and many other terms) is the task of finding records in a data set that refer to the same entity across different data sources (e.g., data files, books, websites, and databases). Record linkage is necessary when joining different data sets based on entities that may or may not share a common identifier (e.g., database key, URI, National identification number), which may be due to differences in record shape, storage location, or curator style or preference. A data set that has undergone RL-oriented reconciliation may be referred to as being cross-linked.
rdf:langString
In de informatica is datamatching een procedure om twee sets data met elkaar te vergelijken. De procedure voert dan een sequentiële analyse uit van elk individueel deel van de data, en koppelt dit aan een individueel deel van de andere dataset. Datamatching kan plaatsvinden om dubbele inhoud te verwijderen of voor verschillende soorten datamining. Een speciale zaak van datamatching is duplicaatdetectie. Vele pogingen van datamatching worden gedaan met het oog op het identificeren van een belangrijke schakel tussen de twee datasets voor onder andere marketing en veiligheid.
xsd:nonNegativeInteger
39128