Ielādē...
Ielādē...
LatvAI-Corpus ir vislielākā publiski pieejamā latviešu valodas tekstu datu kopa AI un ML modelūu apmācībai. Satur 2.4 milj. tekstu fragmentu no ziņu portāliem,
LatvAI-Corpus ir atvērts akadēmiskais datasets, kuru var izmantot NLP modelūu apmācībai latviešu valodā. Tas satur:
JSON · CSV · Parquet · HuggingFace Dataset format
CC-BY 4.0 — braīva lietošana ar atsauci.