ČESKÁ TECHNICKÁ NORMA
ICS 35.240.15 Únor 2019
Informační technologie – Formáty
výměny biometrických dat – |
ČSN 36 9860 |
Information technology – Biometric
data interchange formats –
Part 13: Voice data
Technologies de
l’information – Formats d’échanges de données biométriques –
Partie 13: Données relatives à la voix
Tato norma je českou verzí mezinárodní normy ISO/IEC 19794 -13:2018. Překlad byl zajištěn Českou agenturou pro standardizaci. Má stejný status jako oficiální verze.
This standard is the Czech version of the
International Standard ISO/IEC 19794 -13:2018. It was translated
by the Czech Agency for Standardization. It has the same status as the official
version.
Národní předmluva
Informace o citovaných dokumentech
ISO/IEC 19785-1 dosud nezavedena
ISO/IEC 2382-37 zavedena v ČSN ISO/IEC 2382-37 (36 9001)
Informační technologie – Slovník – Část 37:
Biometrika
Souvisící ČSN
ČSN EN ISO 3166-1 (97 1002) Kódy pro názvy zemí a jejich částí – Část 1: Kódy zemí
ČSN ISO 8601 (97 9738) Datové prvky a formáty výměny – Výměna informací – Zobrazení data a času
Vysvětlivky k textu převzaté normy
Pro účely této normy byly použity následující anglické termíny v původní podobě, vzhledem k rozšíření těchto termínů v odborné komunitě a/nebo absenci českého ekvivalentu:
call centrum, handsfree, preemfáze, streamování
Pro účely této normy jsou pro typy položek polí a pro hodnoty polí použity anglické termíny a nejsou překládány do češtiny z důvodu počítačového zpracování a programovacích nástrojů, a také z důvodu jejich používání v odborné komunitě.
Vypracování normy
Zpracovatel: Ing. Vladimír Pračke, IČO 40654419
Technická normalizační komise: TNK 42 Výměna dat
Pracovník České agentury pro standardizaci: Ing. Miroslav Škop
Česká agentura pro standardizaci
je státní příspěvková organizace zřízená Úřadem pro technickou normalizaci,
metrologii a státní zkušebnictví na základě ustanovení § 5 odst.
2 zákona č. 22/1997 Sb., o technických poža-
davcích na výrobky a o změně a doplnění některých zákonů, ve znění pozdějších předpisů.
Informační technologie –
Formáty výměny biometrických dat – ISO/IEC 19794 -13
Část 13: Hlasová data První vydání
2018-03
ICS 35.240.15
Obsah
Strana
Předmluva..................................................................................................................................................................................................... 5
Úvod................................................................................................................................................................................................................ 6
1......... Předmět normy................................................................................................................................................................................ 7
2......... Citované dokumenty....................................................................................................................................................................... 7
3......... Termíny a definice........................................................................................................................................................................... 7
4......... Zkrácené termíny........................................................................................................................................................................... 11
5......... Shoda.............................................................................................................................................................................................. 11
6......... Procesy a identifikátory................................................................................................................................................................ 12
6.1...... Procesy zachycení a projevy....................................................................................................................................................... 12
6.1.1... Úvod................................................................................................................................................................................................. 12
6.1.2... Hlasový projev............................................................................................................................................................................... 12
6.1.3... Struktura procesu zachycení....................................................................................................................................................... 12
6.2...... Registrované identifikátory typu formátu.................................................................................................................................. 14
7......... Obecný formát výměny hlasových dat (BDB).......................................................................................................................... 14
7.1...... Přehled............................................................................................................................................................................................ 14
7.2...... Konvence........................................................................................................................................................................................ 14
7.3...... Obecné záhlaví hlasového záznamu........................................................................................................................................ 15
7.3.1... Přehled............................................................................................................................................................................................ 15
7.3.2... Verze................................................................................................................................................................................................ 15
7.3.3... ID relace.......................................................................................................................................................................................... 15
7.3.4... Kanál................................................................................................................................................................................................ 15
7.3.5... Zařízení pro zachycení................................................................................................................................................................. 16
7.3.6... Snímač............................................................................................................................................................................................ 16
7.3.7... Audio metainformace................................................................................................................................................................... 17
7.3.8... Protokol procesu zachycení........................................................................................................................................................ 17
7.3.9... Rozšířená data prodejce.............................................................................................................................................................. 18
7.4...... Záhlaví hlasové reprezentace..................................................................................................................................................... 18
7.4.1... Přehled............................................................................................................................................................................................ 18
7.4.2... Datum a čas................................................................................................................................................................................... 18
7.4.3... Zvukový obsah............................................................................................................................................................................... 19
7.4.4... Informace o kvalitě........................................................................................................................................................................ 20
7.4.5... Vylepšení signálu.......................................................................................................................................................................... 21
7.4.6... Rozšířená data prodejce.............................................................................................................................................................. 22
Strana
7.5...... Data hlasové reprezentace......................................................................................................................................................... 22
7.6...... Schéma........................................................................................................................................................................................... 22
7.7...... Příklad.............................................................................................................................................................................................. 27
Příloha A (normativní) Metodika testování shody................................................................................................................................ 28
Bibliografie.................................................................................................................................................................................................. 29
DOKUMENT CHRÁNĚNÝ COPYRIGHTEM |
© ISO 2018 Veškerá práva vyhrazena. Žádná část této publikace nesmí být,
není-li specifikováno jinak nebo nepožaduje-li se to v souvislosti s její ISO copyright office CP 401 · Ch. de Blandonnet 8 CH-1214 Vernier, Geneva Tel.: + 41 22 749 01 11 Fax: + 41 22 749 09 47 E-mail: copyright@iso.org Web: www.iso.org Publikováno ve Švýcarsku |
ISO (Mezinárodní organizace pro normalizaci) a IEC (Mezinárodní elektrotechnická komise) tvoří specializovaný systém celosvětové normalizace. Národní orgány, které jsou členy ISO nebo IEC, se podílejí na vypracování mezinárodních norem prostřednictvím svých technických komisí ustavených příslušnými organizacemi pro jednotlivé obory technické činnosti. Technické komise ISO a IEC spolupracují v oborech společného zájmu. Práce se zúčastňují také další vládní i nevládní mezinárodní organizace, s nimiž ISO a IEC navázaly pracovní styk. V oblasti informační technologie zřídily ISO a IEC společnou technickou komisi ISO/IEC JTC 1.
Postupy použité při tvorbě tohoto dokumentu a postupy určené pro jeho další udržování jsou popsány ve směrnicích ISO/IEC, část 1. Zejména se má věnovat pozornost rozdílným schvalovacím kritériím potřebným pro různé druhy dokumentů ISO. Tento dokument byl vypracován v souladu s redakčními pravidly uvedenými ve směrnicích ISO/IEC, část 2 (viz www.iso.org/directives).
Upozorňuje se na možnost, že některé prvky tohoto dokumentu mohou být předmětem patentových práv. ISO a IEC nelze činit odpovědnými za identifikaci jakéhokoliv nebo všech patentových práv. Podrobnosti o jakýchkoliv patentových právech identifikovaných během přípravy tohoto dokumentu budou uvedeny v úvodu a/nebo v seznamu patentových prohlášení obdržených ISO (viz www.iso.org/patents).
Jakýkoliv obchodní název použitý v tomto dokumentu se uvádí jako informace pro usnadnění práce uživatelů a neznamená schválení.
Vysvětlení nezávazného charakteru technických norem, významu
specifických termínů a výrazů ISO, které se vztahují k posuzování
shody, jakož i informace o tom, jak ISO dodržuje principy Světové
obchodní organizace (WTO) týkající se technických překážek obchodu (TBT), jsou
uvedeny na tomto odkazu URL:
www.iso.org/iso/foreword.html.
Tento dokument vypracovala společná technická komise ISO/IEC/JTC 1 Informační technologie, subkomise SC 37 Biometrika.
Seznam všech částí souboru ISO/IEC 19794 lze nalézt na webových stránkách ISO.
Tento dokument předpokládá, že záznam výměny hlasových dat má být přiřazen jediné jednotlivé osobě a zaznamenán v jediné relaci. Hlasová data představují časový záznam slyšitelných, akustických vibrací produkovaných člověkem v průběhu slovní interakce a obecně obsahují jak řečové, tak i neřečové zvuky, stejně jako nevokální zvuky, které se v tomto kontextu považují za „šum“. Kromě poskytování jazykových funkcí přenosu sémantických informací obsahují hlasová data jak zvukové, tak sémantické informace, které lze použít k rozpoznání řečníků. Předmětem tohoto dokumentu je sběr, ukládání a přenos hlasových dat obsahujících řeč za účelem rozpoznání jednotlivých osob.
Tento formát je speciálně navržen tak, aby podporoval širokou škálu aplikací pro automatické rozpoznávání řečníka, včetně textově závislé a textově nezávislé identifikace a verifikace (Speaker Identification and Verification (SIV)) řečníka a registrace, s minimálními předpoklady ohledně podmínek zachycení hlasových dat nebo prostředí pro sběr. Tento dokument by měl být dostatečně obecný, aby mohly být podporovány i aplikace pro rozpoznávání řečníka mimo tradiční SIV, jako je propojení projevů se stejným neznámým řečníkem a stanovení, že známý řečník není zdrojem projevu. Rozlišení mezi řečí použitou k vytvoření reference pro budoucí porovnání (které se v některých aplikacích nazývá „registrace“) a řečí použitou k vytvoření hlasových reprezentací (voice representations (VRs)) dotazovaných vůči referencím, by se mohlo objevit pouze v okamžiku aplikace, kdy každý uložený záznam řeči potenciálně podporuje buď vytvoření reference, nebo dotazu. Automatizované rozpoznávání řečníka by dále mohlo zahrnovat souvisící technologie, jako je rozpoznávání řeči a jazyka, a to nejen v současných algoritmech a aplikacích, ale i v budoucnosti způsoby, které nelze předvídat. Proto je tento dokument napsán z velmi širokého hlediska se záměrem podpořit co nejširší možný rozsah aplikací pro rozpoznávání řeči a technických přístupů.
Tento dokument specifikuje formát výměny dat, který lze použít k ukládání, záznamu a přenosu digitalizovaných akustických lidských hlasových dat (řeči), u kterých se předpokládá, že pocházejí od jednoho řečníka a byly zaznamenány v jediné relaci. Tento formát je speciálně navržen tak, aby podporoval širokou škálu aplikací pro identifikaci a verifikaci řečníka (SIV), a to jak textově závislých, tak i textově nezávislých, s minimálními předpoklady týkajícími se podmínek zachycení hlasových dat nebo prostředí sběru dat. Jiné použití dat zapouzdřených v tomto formátu, například automatizované rozpoznávání řeči (ASR), může být možné, ale tento dokumentu se jím nezabývá. Tento dokument se rovněž nezabývá zacházení s daty, která byla zpracována na úrovně modelu rysů nebo hlasového modelu. V tomto dokumentu nejsou uvedeny žádné požadavky, zařízení nebo funkce specifické pro danou aplikaci. Tento dokument podporuje případné zahrnutí nestandardních rozšířených dat. Tento dokument umožňuje výměnu jak originálních zachycených dat, tak i digitálně zpracovaných (zvýrazněných) hlasových dat. Popis jakéhokoli zpracování původního zdrojového vstupu je určen k zahrnutí do metadat spojených s hlasovými reprezentacemi (VR). Tento dokument se nezabývá streamováním dat.
Ustanovení o vyznačování času u uchovávaných a přenášených biometrických údajů a o použití kryptografických technik k ochraně jejich autenticity, integrity a důvěrnosti jsou mimo rozsah tohoto dokumentu.
Informace naformátované v souladu s tímto dokumentem mohou být zaznamenány na strojově čitelná média nebo mohou být přenášeny datovou komunikací mezi systémy.
Po obecném obsahově orientovaném článku popisujícím formát výměny hlasových dat následuje článek zabývající se definicí XML schématu.
Tento dokument obsahuje slovní zásobu obecně užívanou komunitou pro rozpoznávání řeči a řečníka a také terminologii z jiných ISO norem.
Konec náhledu - text dále pokračuje v placené verzi ČSN.
Zdroj: www.cni.cz