Visual Bank breidt “Qlean Dataset” uit ter ondersteuning van grootschalige Japanse spraakbasismodellen
Meer dan 100.000 uur aan rechtenvrije Japanse audio, inclusief regionale dialecten en cultureel contextgebonden spraak die essentieel is voor de ontwikkeling van commerciële AI.
TOKIO–(BUSINESS WIRE)– Visual Bank Group breidt Qlean Dataset uit door gebruik te maken van ruim 40 jaar expertise van amanaimages inc. De uitbreiding biedt hoogwaardige, juridisch getoetste Japanse taalcorpora, inclusief meer dan 100.000 uur aan audio voor commercieel gebruik.
Dit persbericht bevat multimedia. Bekijk hier het volledige persbericht: https://www.businesswire.com/news/home/20260401057306/nl/
Visual Bank Group breidt de Qlean Dataset uit met ruim 40 jaar expertise van amanaimages inc. en levert hoogwaardige, rechtengeklaarde Japanse taalcorpora, inclusief meer dan 100.000 uur aan commercieel bruikbare audio.
Het bedrijf heeft zich gepositioneerd als toonaangevende leverancier voor Japanstalige data-infrastructuur dankzij een nieuwe ontwikkeling binnen de Qlean Dataset-divisie. Het zal datasets leveren aan instellingen die zich bezighouden met onderzoek en ontwikkeling, waarbij de rechten zijn vrijgegeven voor AI-training en grootschalige datatoepassingen. De datasets bestaan vooral uit gestructureerde corpora van Japanse spraak, geordend op basis van sprekersconfiguratie en thematisch domein.
Belangrijkste kenmerken voor AI-ontwikkelaars
-
Rechtengeklaarde gegevens voor commercieel gebruik
Alle datasets zijn volledig rechtengeklaard voor commercieel gebruik en voldoen aan wereldwijde nalevingsnormen zoals AVG (GDPR) en CCPA. -
High-fidelity audio-assets
Opnamen op 48kHz/16bit of hoger leggen zowel spraak van studiokwaliteit als akoestische omgevingen vast. -
Deskundige menselijke annotatie
Transcripten op moedertaalniveau en gestructureerde metadata bieden datasets die klaar zijn voor training voor AI-ontwikkeling. -
Datasets voor veiligheid en moderatie
Datasets ondersteunen de detectie van schadelijk taalgebruik, inclusief haatzaaiende uitlatingen en misbruikende aanwijzingen (prompts). -
Japanse evaluatiedatasets
Evaluatiedatasets zijn afgestemd op internationale benchmarks zoals MMSU om redenering en taalkundige nuances in het Japans te meten. -
Japan-specifieke akoestische omgevingen
Japan-specifieke audio, inclusief traditionele instrumenten, heiligdommen en stedelijke omgevingen, ondersteunt multimodale en ruimtelijke AI.
AI Data Recipe
https://qleandataset.visual-bank.co.jp/en/lineup
Japanse taalcorpora
https://qleandataset.visual-bank.co.jp/en/products/japanese-language-corpora
Deze bekendmaking is officieel geldend in de originele brontaal. Vertalingen zijn slechts als leeshulp bedoeld en moeten worden vergeleken met de tekst in de brontaal, die als enige rechtsgeldig is.
Bekijk het oorspronkelijke bericht op businesswire.com: https://www.businesswire.com/news/home/20260401057306/nl/
Contacts
Inlichtingen / Vragen
https://qleandataset.visual-bank.co.jp/en/contact
Visual Bank Inc.
qlean-dataset@visual-bank.co.jp
