ČESKÁ TECHNICKÁ NORMA

ICS 35.240.15                                                                                                                                     Únor 2019

Informační technologie – Formáty výměny biometrických dat –
Část 13: Hlasová data

ČSN
ISO/IEC 19794 -13

36 9860

 

Information technology – Biometric data interchange formats –
Part 13: Voice data

Technologies de l’information – Formats d’échanges de données biométriques –
Partie 13: Données relatives à la voix

Tato norma je českou verzí mezinárodní normy ISO/IEC 19794 -13:2018. Překlad byl zajištěn Českou agenturou pro standardizaci. Má stejný status jako oficiální verze.

This standard is the Czech version of the International Standard ISO/IEC 19794 -13:2018. It was translated
by the Czech Agency for Standardization. It has the same status as the official version
.

 


Národní předmluva

Informace o citovaných dokumentech

ISO/IEC 19794-1 zavedena v ČSN ISO/IEC 19794-1 (36 9860) Informační technologie – Formáty výměny biometrických dat – Část 1: Struktura

ISO/IEC 19785-1 dosud nezavedena

ISO/IEC 2382-37 zavedena v ČSN ISO/IEC 2382-37 (36 9001) Informační technologie – Slovník – Část 37:
Biometrika

Souvisící ČSN

ČSN EN ISO 3166-1 (97 1002) Kódy pro názvy zemí a jejich částí – Část 1: Kódy zemí

ČSN ISO 8601 (97 9738) Datové prvky a formáty výměny – Výměna informací – Zobrazení data a času

Vysvětlivky k textu převzaté normy

Pro účely této normy byly použity následující anglické termíny v původní podobě, vzhledem k rozšíření těchto termínů v odborné komunitě a/nebo absenci českého ekvivalentu:

call centrum, handsfree, preemfáze, streamování

Pro účely této normy jsou pro typy položek polí a pro hodnoty polí použity anglické termíny a nejsou překládány do češtiny z důvodu počítačového zpracování a programovacích nástrojů, a také z důvodu jejich používání v odborné komunitě.

Vypracování normy

Zpracovatel: Ing. Vladimír Pračke, IČO 40654419

Technická normalizační komise: TNK 42 Výměna dat

Pracovník České agentury pro standardizaci: Ing. Miroslav Škop

Česká agentura pro standardizaci je státní příspěvková organizace zřízená Úřadem pro technickou normalizaci, metrologii a státní zkušebnictví na základě ustanovení § 5 odst. 2 zákona č. 22/1997 Sb., o technických poža-
davcích na výrobky a o změně a 
doplnění některých zákonů, ve znění pozdějších předpisů.

MEZINÁRODNÍ NORMA

Informační technologie – Formáty výměny biometrických dat –              ISO/IEC 19794 -13
Část 13: Hlasová data                                                                                           První vydání
                                                                                                                                    2018-03

ICS 35.240.15

Obsah

Strana

Předmluva..................................................................................................................................................................................................... 5

Úvod................................................................................................................................................................................................................ 6

1......... Předmět normy................................................................................................................................................................................ 7

2......... Citované dokumenty....................................................................................................................................................................... 7

3......... Termíny a definice........................................................................................................................................................................... 7

4......... Zkrácené termíny........................................................................................................................................................................... 11

5......... Shoda.............................................................................................................................................................................................. 11

6......... Procesy a identifikátory................................................................................................................................................................ 12

6.1...... Procesy zachycení a projevy....................................................................................................................................................... 12

6.1.1... Úvod................................................................................................................................................................................................. 12

6.1.2... Hlasový projev............................................................................................................................................................................... 12

6.1.3... Struktura procesu zachycení....................................................................................................................................................... 12

6.2...... Registrované identifikátory typu formátu.................................................................................................................................. 14

7......... Obecný formát výměny hlasových dat (BDB).......................................................................................................................... 14

7.1...... Přehled............................................................................................................................................................................................ 14

7.2...... Konvence........................................................................................................................................................................................ 14

7.3...... Obecné záhlaví hlasového záznamu........................................................................................................................................ 15

7.3.1... Přehled............................................................................................................................................................................................ 15

7.3.2... Verze................................................................................................................................................................................................ 15

7.3.3... ID relace.......................................................................................................................................................................................... 15

7.3.4... Kanál................................................................................................................................................................................................ 15

7.3.5... Zařízení pro zachycení................................................................................................................................................................. 16

7.3.6... Snímač............................................................................................................................................................................................ 16

7.3.7... Audio metainformace................................................................................................................................................................... 17

7.3.8... Protokol procesu zachycení........................................................................................................................................................ 17

7.3.9... Rozšířená data prodejce.............................................................................................................................................................. 18

7.4...... Záhlaví hlasové reprezentace..................................................................................................................................................... 18

7.4.1... Přehled............................................................................................................................................................................................ 18

7.4.2... Datum a čas................................................................................................................................................................................... 18

7.4.3... Zvukový obsah............................................................................................................................................................................... 19

7.4.4... Informace o kvalitě........................................................................................................................................................................ 20

7.4.5... Vylepšení signálu.......................................................................................................................................................................... 21

7.4.6... Rozšířená data prodejce.............................................................................................................................................................. 22

Strana

7.5...... Data hlasové reprezentace......................................................................................................................................................... 22

7.6...... Schéma........................................................................................................................................................................................... 22

7.7...... Příklad.............................................................................................................................................................................................. 27

Příloha A (normativní) Metodika testování shody................................................................................................................................ 28

Bibliografie.................................................................................................................................................................................................. 29

 

Logo0052b

DOKUMENT CHRÁNĚNÝ COPYRIGHTEM

© ISO 2018

Veškerá práva vyhrazena. Žádná část této publikace nesmí být, není-li specifikováno jinak nebo nepožaduje-li se to v souvislosti s její
implementací, reprodukována nebo používána v jakékoliv formě nebo jakýmkoliv způsobem, elektronickým ani mechanickým, včetně
pořizování fotokopií nebo zveřejňování na internetu nebo intranetu, bez předchozího písemného souhlasu. O souhlas lze požádat buď ISO na níže uvedené adrese, nebo členskou organizaci ISO v zemi žadatele.

ISO copyright office

CP 401 · Ch. de Blandonnet 8

CH-1214 Vernier, Geneva

Tel.: + 41 22 749 01 11

Fax: + 41 22 749 09 47

E-mail: copyright@iso.org

Web: www.iso.org

Publikováno ve Švýcarsku

Předmluva

ISO (Mezinárodní organizace pro normalizaci) a IEC (Mezinárodní elektrotechnická komise) tvoří specializovaný systém celosvětové normalizace. Národní orgány, které jsou členy ISO nebo IEC, se podílejí na vypracování mezinárodních norem prostřednictvím svých technických komisí ustavených příslušnými organizacemi pro jednotlivé obory technické činnosti. Technické komise ISO a IEC spolupracují v oborech společného zájmu. Práce se zúčastňují také další vládní i nevládní mezinárodní organizace, s nimiž ISO a IEC navázaly pracovní styk. V oblasti informační technologie zřídily ISO a IEC společnou technickou komisi ISO/IEC JTC 1.

Postupy použité při tvorbě tohoto dokumentu a postupy určené pro jeho další udržování jsou popsány ve směrnicích ISO/IEC, část 1. Zejména se má věnovat pozornost rozdílným schvalovacím kritériím potřebným pro různé druhy dokumentů ISO. Tento dokument byl vypracován v souladu s redakčními pravidly uvedenými ve směrnicích ISO/IEC, část 2 (viz www.iso.org/directives).

Upozorňuje se na možnost, že některé prvky tohoto dokumentu mohou být předmětem patentových práv. ISO a IEC nelze činit odpovědnými za identifikaci jakéhokoliv nebo všech patentových práv. Podrobnosti o jakýchkoliv patentových právech identifikovaných během přípravy tohoto dokumentu budou uvedeny v úvodu a/nebo v seznamu patentových prohlášení obdržených ISO (viz www.iso.org/patents).

Jakýkoliv obchodní název použitý v tomto dokumentu se uvádí jako informace pro usnadnění práce uživatelů a neznamená schválení.

Vysvětlení nezávazného charakteru technických norem, významu specifických termínů a výrazů ISO, které se vztahují k posuzování shody, jakož i informace o tom, jak ISO dodržuje principy Světové obchodní organizace (WTO) týkající se technických překážek obchodu (TBT), jsou uvedeny na tomto odkazu URL:      
www.iso.org/iso/foreword.html.

Tento dokument vypracovala společná technická komise ISO/IEC/JTC 1 Informační technologie, subkomise SC 37 Biometrika.

Seznam všech částí souboru ISO/IEC 19794 lze nalézt na webových stránkách ISO.

Úvod

Tento dokument předpokládá, že záznam výměny hlasových dat má být přiřazen jediné jednotlivé osobě a zaznamenán v jediné relaci. Hlasová data představují časový záznam slyšitelných, akustických vibrací produkovaných člověkem v průběhu slovní interakce a obecně obsahují jak řečové, tak i neřečové zvuky, stejně jako nevokální zvuky, které se v tomto kontextu považují za „šum“. Kromě poskytování jazykových funkcí přenosu sémantických informací obsahují hlasová data jak zvukové, tak sémantické informace, které lze použít k rozpoznání řečníků. Předmětem tohoto dokumentu je sběr, ukládání a přenos hlasových dat obsahujících řeč za účelem rozpoznání jednotlivých osob.

Tento formát je speciálně navržen tak, aby podporoval širokou škálu aplikací pro automatické rozpoznávání řečníka, včetně textově závislé a textově nezávislé identifikace a verifikace (Speaker Identification and Verification (SIV)) řečníka a registrace, s minimálními předpoklady ohledně podmínek zachycení hlasových dat nebo prostředí pro sběr. Tento dokument by měl být dostatečně obecný, aby mohly být podporovány i aplikace pro rozpoznávání řečníka mimo tradiční SIV, jako je propojení projevů se stejným neznámým řečníkem a stanovení, že známý řečník není zdrojem projevu. Rozlišení mezi řečí použitou k vytvoření reference pro budoucí porovnání (které se v některých aplikacích nazývá „registrace“) a řečí použitou k vytvoření hlasových reprezentací (voice representations (VRs)) dotazovaných vůči referencím, by se mohlo objevit pouze v okamžiku aplikace, kdy každý uložený záznam řeči potenciálně podporuje buď vytvoření reference, nebo dotazu. Automatizované rozpoznávání řečníka by dále mohlo zahrnovat souvisící technologie, jako je rozpoznávání řeči a jazyka, a to nejen v současných algoritmech a aplikacích, ale i v budoucnosti způsoby, které nelze předvídat. Proto je tento dokument napsán z velmi širokého hlediska se záměrem podpořit co nejširší možný rozsah aplikací pro rozpoznávání řeči a technických přístupů.

1 Předmět normy

Tento dokument specifikuje formát výměny dat, který lze použít k ukládání, záznamu a přenosu digitalizovaných akustických lidských hlasových dat (řeči), u kterých se předpokládá, že pocházejí od jednoho řečníka a byly zaznamenány v jediné relaci. Tento formát je speciálně navržen tak, aby podporoval širokou škálu aplikací pro identifikaci a verifikaci řečníka (SIV), a to jak textově závislých, tak i textově nezávislých, s minimálními předpoklady týkajícími se podmínek zachycení hlasových dat nebo prostředí sběru dat. Jiné použití dat zapouzdřených v tomto formátu, například automatizované rozpoznávání řeči (ASR), může být možné, ale tento dokumentu se jím nezabývá. Tento dokument se rovněž nezabývá zacházení s daty, která byla zpracována na úrovně modelu rysů nebo hlasového modelu. V tomto dokumentu nejsou uvedeny žádné požadavky, zařízení nebo funkce specifické pro danou aplikaci. Tento dokument podporuje případné zahrnutí nestandardních rozšířených dat. Tento dokument umožňuje výměnu jak originálních zachycených dat, tak i digitálně zpracovaných (zvýrazněných) hlasových dat. Popis jakéhokoli zpracování původního zdrojového vstupu je určen k zahrnutí do metadat spojených s hlasovými reprezentacemi (VR). Tento dokument se nezabývá streamováním dat.

Ustanovení o vyznačování času u uchovávaných a přenášených biometrických údajů a o použití kryptografických technik k ochraně jejich autenticity, integrity a důvěrnosti jsou mimo rozsah tohoto dokumentu.

Informace naformátované v souladu s tímto dokumentem mohou být zaznamenány na strojově čitelná média nebo mohou být přenášeny datovou komunikací mezi systémy.

Po obecném obsahově orientovaném článku popisujícím formát výměny hlasových dat následuje článek zabývající se definicí XML schématu.

Tento dokument obsahuje slovní zásobu obecně užívanou komunitou pro rozpoznávání řeči a řečníka a také terminologii z jiných ISO norem.

 

 

Konec náhledu - text dále pokračuje v placené verzi ČSN.

Zdroj: www.cni.cz