Peraulis clâf
- Lenghistiche computazionâ,
- lenghis naturâls,
- tescj scrits,
- tescj orâi
Cemût citâ
Ristret
In chest articul il concet di corpus lenghistic – un prodot dai plui impuartants de lenghistiche computazionâl resinte – si lu specifiche tant che une largje ricolte di tescj di une o plui lenghis naturâls, formalmentri struturade e descrite daûr de lenghistiche. La lenghistiche di cumò e cjale il corpus tant che un gnûf paradigme che lu puedin doprâ no dome i lenghiscj, ma ancje chei altris specialiscj di diviersis dissiplinis sientifichis, massime di chês umanis. Il pês dai corpus inte lenghistiche moderne al ven tratât e pandût a mieç dai aspiets clâf dai corpus: fate dai corpus; dimension dai corpus; il meti sù e la sielte dai tescj di un corpus, cjalant la rapresentativitât dal corpus (a rivuart di un fin dât di prime); la struture interne dal corpus e la nature e il sens des informazions lenghistichis intun corpus, che a varan une atenzion speciâl. I esemplis pai diviers aspiets dai corpus a vegnin massime dal Corpus Nazionâl Cec (CNC).