08:00 uur 03-04-2026

Visual Bank breidt “Qlean Dataset” uit ter ondersteuning van grootschalige Japanse spraakbasismodellen

Meer dan 100.000 uur aan rechtenvrije Japanse audio, inclusief regionale dialecten en cultureel contextgebonden spraak die essentieel is voor de ontwikkeling van commerciële AI.

TOKIO–(BUSINESS WIRE)– Visual Bank Group breidt Qlean Dataset uit door gebruik te maken van ruim 40 jaar expertise van amanaimages inc. De uitbreiding biedt hoogwaardige, juridisch getoetste Japanse taalcorpora, inclusief meer dan 100.000 uur aan audio voor commercieel gebruik.

Dit persbericht bevat multimedia. Bekijk hier het volledige persbericht: https://www.businesswire.com/news/home/20260401057306/nl/

Visual Bank Group breidt de Qlean Dataset uit met ruim 40 jaar expertise van amanaimages inc. en levert hoogwaardige, rechtengeklaarde Japanse taalcorpora, inclusief meer dan 100.000 uur aan commercieel bruikbare audio.

Visual Bank Group breidt de Qlean Dataset uit met ruim 40 jaar expertise van amanaimages inc. en levert hoogwaardige, rechtengeklaarde Japanse taalcorpora, inclusief meer dan 100.000 uur aan commercieel bruikbare audio.

Het bedrijf heeft zich gepositioneerd als toonaangevende leverancier voor Japanstalige data-infrastructuur dankzij een nieuwe ontwikkeling binnen de Qlean Dataset-divisie. Het zal datasets leveren aan instellingen die zich bezighouden met onderzoek en ontwikkeling, waarbij de rechten zijn vrijgegeven voor AI-training en grootschalige datatoepassingen. De datasets bestaan vooral uit gestructureerde corpora van Japanse spraak, geordend op basis van sprekersconfiguratie en thematisch domein.

Belangrijkste kenmerken voor AI-ontwikkelaars

  • Rechtengeklaarde gegevens voor commercieel gebruik

    Alle datasets zijn volledig rechtengeklaard voor commercieel gebruik en voldoen aan wereldwijde nalevingsnormen zoals AVG (GDPR) en CCPA.
  • High-fidelity audio-assets

    Opnamen op 48kHz/16bit of hoger leggen zowel spraak van studiokwaliteit als akoestische omgevingen vast.
  • Deskundige menselijke annotatie

    Transcripten op moedertaalniveau en gestructureerde metadata bieden datasets die klaar zijn voor training voor AI-ontwikkeling.
  • Datasets voor veiligheid en moderatie

    Datasets ondersteunen de detectie van schadelijk taalgebruik, inclusief haatzaaiende uitlatingen en misbruikende aanwijzingen (prompts).
  • Japanse evaluatiedatasets

    Evaluatiedatasets zijn afgestemd op internationale benchmarks zoals MMSU om redenering en taalkundige nuances in het Japans te meten.
  • Japan-specifieke akoestische omgevingen

    Japan-specifieke audio, inclusief traditionele instrumenten, heiligdommen en stedelijke omgevingen, ondersteunt multimodale en ruimtelijke AI.

AI Data Recipe

https://qleandataset.visual-bank.co.jp/en/lineup

Japanse taalcorpora

https://qleandataset.visual-bank.co.jp/en/products/japanese-language-corpora

Deze bekendmaking is officieel geldend in de originele brontaal. Vertalingen zijn slechts als leeshulp bedoeld en moeten worden vergeleken met de tekst in de brontaal, die als enige rechtsgeldig is.

Contacts

Inlichtingen / Vragen
https://qleandataset.visual-bank.co.jp/en/contact

Visual Bank Inc.

qlean-dataset@visual-bank.co.jp

Check out our twitter: @NewsNovumpr