08:00 uur 03-04-2026

Visual Bank breidt “Qlean Dataset” uit ter ondersteuning van grootschalige Japanse spraakbasismodellen

Meer dan 100.000 uur aan rechtenvrije Japanse audio, inclusief regionale dialecten en cultureel contextgebonden spraak die essentieel is voor de ontwikkeling van commerciële AI.

TOKIO–(BUSINESS WIRE)– Visual Bank Group breidt Qlean Dataset uit door gebruik te maken van ruim 40 jaar expertise van amanaimages inc. De uitbreiding biedt hoogwaardige, juridisch getoetste Japanse taalcorpora, inclusief meer dan 100.000 uur aan audio voor commercieel gebruik.

Dit persbericht bevat multimedia. Bekijk hier het volledige persbericht: https://www.businesswire.com/news/home/20260401057306/nl/

Visual Bank Group breidt de Qlean Dataset uit met ruim 40 jaar expertise van amanaimages inc. en levert hoogwaardige, rechtengeklaarde Japanse taalcorpora, inclusief meer dan 100.000 uur aan commercieel bruikbare audio.

Het bedrijf heeft zich gepositioneerd als toonaangevende leverancier voor Japanstalige data-infrastructuur dankzij een nieuwe ontwikkeling binnen de Qlean Dataset-divisie. Het zal datasets leveren aan instellingen die zich bezighouden met onderzoek en ontwikkeling, waarbij de rechten zijn vrijgegeven voor AI-training en grootschalige datatoepassingen. De datasets bestaan vooral uit gestructureerde corpora van Japanse spraak, geordend op basis van sprekersconfiguratie en thematisch domein.

Belangrijkste kenmerken voor AI-ontwikkelaars

Rechtengeklaarde gegevens voor commercieel gebruik

Alle datasets zijn volledig rechtengeklaard voor commercieel gebruik en voldoen aan wereldwijde nalevingsnormen zoals AVG (GDPR) en CCPA.
High-fidelity audio-assets

Opnamen op 48kHz/16bit of hoger leggen zowel spraak van studiokwaliteit als akoestische omgevingen vast.
Deskundige menselijke annotatie

Transcripten op moedertaalniveau en gestructureerde metadata bieden datasets die klaar zijn voor training voor AI-ontwikkeling.
Datasets voor veiligheid en moderatie

Datasets ondersteunen de detectie van schadelijk taalgebruik, inclusief haatzaaiende uitlatingen en misbruikende aanwijzingen (prompts).
Japanse evaluatiedatasets

Evaluatiedatasets zijn afgestemd op internationale benchmarks zoals MMSU om redenering en taalkundige nuances in het Japans te meten.
Japan-specifieke akoestische omgevingen

Japan-specifieke audio, inclusief traditionele instrumenten, heiligdommen en stedelijke omgevingen, ondersteunt multimodale en ruimtelijke AI.

AI Data Recipe

https://qleandataset.visual-bank.co.jp/en/lineup

Japanse taalcorpora

https://qleandataset.visual-bank.co.jp/en/products/japanese-language-corpora

Deze bekendmaking is officieel geldend in de originele brontaal. Vertalingen zijn slechts als leeshulp bedoeld en moeten worden vergeleken met de tekst in de brontaal, die als enige rechtsgeldig is.

Bekijk het oorspronkelijke bericht op businesswire.com: https://www.businesswire.com/news/home/20260401057306/nl/

Contacts

Inlichtingen / Vragen
https://qleandataset.visual-bank.co.jp/en/contact

Visual Bank Inc.

qlean-dataset@visual-bank.co.jp

Check out our twitter: @NewsNovumpr