ከበርካታ አስርት ዓመታት በፊት ሳይንቲስቶች ማለም የቻሉት የቋንቋ ምርምርን በራስ ሰር የማዘጋጀት ብቻ ነው። ስራው በእጅ ተከናውኗል, ብዙ ቁጥር ያላቸው ተማሪዎች በእሱ ውስጥ ተሳትፈዋል, "ትኩረት የጎደለው" ስህተት ከፍተኛ ዕድል ነበረው, እና ከሁሉም በላይ, ሁሉም ነገር ብዙ እና ብዙ ጊዜ ወስዷል.
በኮምፒዩተር ቴክኖሎጅ እድገት ጥናትን በፍጥነት ማካሄድ የተቻለ ሲሆን ዛሬ ደግሞ በቋንቋ ጥናት ውስጥ ተስፋ ሰጭ ከሆኑ ዘርፎች አንዱ ኮርፐስ ሊንጉስቲክስ ነው። ዋናው ባህሪው ከፍተኛ መጠን ያላቸውን የፅሁፍ መረጃዎችን መጠቀም፣ ወደ አንድ የውሂብ ጎታ የተጠናከረ፣ በልዩ መንገድ ምልክት የተደረገበት እና ኮርፐስ ይባላል።
ዛሬ፣ ከተለያዩ የቋንቋ ማቴሪያሎች ላይ ተመስርተው ለተለያዩ ዓላማዎች የተፈጠሩ፣ ከሚሊዮኖች እስከ አስር ቢሊየን የሚቆጠር የቃላት አሃዶችን የሚሸፍኑ ብዙ ኮርፖራዎች አሉ። ይህ አቅጣጫ ተስፋ ሰጭ እና የተተገበሩ እና የምርምር ግቦችን ከማሳካት አንፃር ከፍተኛ እድገትን ያሳያል። ባለሙያዎች, አንድ መንገድ ወይም ሌላ ግንኙነትየተፈጥሮ ቋንቋ፣ ቢያንስ በመሠረታዊ ደረጃ እራስዎን ከጽሑፍ ኮርፖራ ጋር እንዲያውቁት ይመከራል።
የኮርፐስ ሊንጉስቲክስ ታሪክ
የዚህ አቅጣጫ አፈጣጠር ባለፈው ክፍለ ዘመን በ60ዎቹ መጀመሪያ ላይ በአሜሪካ ብራውን ኮርፕስ ከመፈጠሩ ጋር የተያያዘ ነው። የጽሑፎቹ ስብስብ 1 ሚሊዮን የቃላት ቅርጾችን ብቻ ያቀፈ ነበር, እና ዛሬ እንደዚህ ያለ ጥራዝ ያለው ኮርፐስ ሙሉ በሙሉ ተወዳዳሪ አይሆንም. ይህ በአብዛኛው በኮምፒዩተር ቴክኖሎጂ እድገት ፍጥነት እና እንዲሁም እየጨመረ ባለው የአዳዲስ የምርምር ሀብቶች ፍላጎት ምክንያት ነው።
በ90ዎቹ ውስጥ ኮርፐስ ሊንጉስቲክስ ወደ ሙሉ እና ገለልተኛ ዲሲፕሊን ተፈጠረ፣የጽሑፎች ስብስቦች ተሰብስበው ለብዙ ደርዘን ቋንቋዎች ተዘጋጅተዋል። በዚህ ወቅት፣ ለምሳሌ፣ የብሪቲሽ ናሽናል ኮርፐስ የተፈጠረው ለ100 ሚሊዮን የቃላት አጠቃቀም ነው።
ይህ የቋንቋ አቅጣጫ እየዳበረ ሲመጣ የጽሑፎቹ መጠን ይበልጣል (እና በቢሊዮኖች የሚቆጠሩ የቃላት አሃዶች ይደርሳል) እና ምልክቱ ከጊዜ ወደ ጊዜ እየጨመረ ይሄዳል። ዛሬ፣ በይነመረብ ቦታ ላይ፣ የፅሁፍ እና የቃል ንግግር፣ ብዙ ቋንቋ እና ትምህርታዊ፣ በልብ ወለድ ወይም በአካዳሚክ ስነ-ጽሁፍ ላይ ያተኮረ እና ሌሎች በርካታ ዝርያዎችን ማግኘት ይችላሉ።
ምን ጉዳዮች አሉ
የኮርፐስ ዓይነቶች በኮርፐስ ሊንጉስቲክስ በተለያዩ መንገዶች ሊወከሉ ይችላሉ። ለምደባው መሠረት የጽሑፎቹ ቋንቋ (ሩሲያኛ ፣ ጀርመንኛ) ፣ የመዳረሻ ሁነታ (ክፍት ምንጭ ፣ የተዘጋ ምንጭ ፣ የንግድ) ፣ የምንጭ ቁሳቁስ ዘውግ (ልብ ወለድ) ሊሆን እንደሚችል በግልፅ ግልፅ ነው።ሥነ ጽሑፍ፣ ዘጋቢ ፊልም፣ አካዳሚክ፣ ጋዜጠኝነት)።
አስደሳች በሆነ መልኩ የቃል ንግግርን የሚወክሉ ቁሳቁሶችን የማፍለቅ ስራ ይከናወናል። እንዲህ ዓይነቱ ንግግር ሆን ብሎ መቅዳት ለተጠያቂዎች ሰው ሰራሽ ሁኔታዎችን ስለሚፈጥር እና የተገኘው ቁሳቁስ "ድንገተኛ" ተብሎ ሊጠራ ስለማይችል የዘመናዊው ኮርፐስ ሊንጉስቲክስ በሌላ መንገድ ሄዷል. ፈቃደኛ ሠራተኛው ማይክሮፎን የተገጠመለት ሲሆን በቀን ውስጥ እሱ የሚሳተፍባቸው ንግግሮች በሙሉ ይመዘገባሉ. በዙሪያው ያሉ ሰዎች በእርግጥ በዕለት ተዕለት ውይይት ውስጥ ለሳይንስ እድገት አስተዋጽኦ እያደረጉ መሆናቸውን ማወቅ አይችሉም።
በኋላ፣ የተቀበሉት የድምጽ ቅጂዎች በመረጃ ቋቱ ውስጥ ተከማችተው እንደ ግልባጭ በታተመ ጽሑፍ ይታጀባሉ። በዚህ መንገድ፣ የንግግር ዕለታዊ ንግግር ኮርፐስ ለመፍጠር የሚያስፈልገው ምልክት ማድረግ ይቻላል።
መተግበሪያ
ቋንቋን መጠቀም በሚቻልበት ቦታ የጽሑፍ ኮርፖሬሽን መጠቀምም ይቻላል። በቋንቋ ጥናት ኮርፐስ ዘዴዎችን የመጠቀም አላማ፡-
ሊሆን ይችላል።
- በፖለቲካ እና ንግድ ውስጥ በስፋት ጥቅም ላይ የሚውሉ ስሜቶችን ፕሮግራሞችን መፍጠር ከመራጮች እና ከደንበኞች የሚሰጡ አወንታዊ እና አሉታዊ ግብረመልሶችን መከታተል።
- የመረጃ ስርዓቱን ከመዝገበ-ቃላት እና ተርጓሚዎች ጋር በማገናኘት አፈፃፀማቸውን ለማሻሻል።
- የቋንቋውን አወቃቀሩ፣የእድገቱን ታሪክ እና ለውጦችን በቅርብ ጊዜ ውስጥ ለመተንበይ የሚያበረክቱ የተለያዩ የምርምር ስራዎች።
- በሥርዓተ-ሞርፎሎጂ ላይ የተመሰረቱ የመረጃ አወጣጥ ሥርዓቶች ልማት፣የአገባብ፣ የትርጉም እና ሌሎች ባህሪያት።
- የተለያዩ የቋንቋ ስርዓቶች ስራን ማሳደግ እና የመሳሰሉት።
ሼሎች በመጠቀም
የመርጃው በይነገጹ ከተለመደው የፍለጋ ሞተር ጋር ተመሳሳይ ነው እና ተጠቃሚው የመረጃ መሰረቱን ለመፈለግ የተወሰነ ቃል ወይም የቃላት ጥምረት እንዲያስገባ ይገፋፋዋል። ከትክክለኛው የጥያቄ ቅፅ በተጨማሪ የተራዘመውን እትም መጠቀም ትችላለህ፣ ይህም በማንኛውም የቋንቋ መስፈርት የፅሁፍ መረጃ እንድታገኝ ያስችልሃል።
የፍለጋው መሰረት፡
ሊሆን ይችላል።
- የተወሰነ የንግግር ክፍሎች አባል የሆነ፤
- ሰዋሰዋዊ ባህሪያት፤
- ትርጉም፤
- ስታሊስቲክ እና ስሜታዊ ቀለም።
እንዲሁም የፍለጋ መመዘኛዎችን ለቃላቶች ተከታታይነት ማጣመር ትችላላችሁ፡ ለምሳሌ፡ ሁሉንም የግስ ክስተቶችን አሁን ባለው ጊዜ ውስጥ አግኝ፣ የመጀመሪያ ሰው፣ ነጠላ ከዚያም "in" የሚለው መስተዋድድ እና በተከሳሽ ጉዳይ ውስጥ ያለ ስም. እንደዚህ አይነት ቀላል ስራ መፍታት ተጠቃሚውን ጥቂት ሰከንዶች ይወስዳል እና በተሰጡት መስኮች ውስጥ ጥቂት የመዳፊት ጠቅታዎችን ብቻ ይፈልጋል።
የመፍጠር ሂደት
ፍለጋው ራሱ በሁሉም ንዑስ ኮርፕሶች ውስጥ እና በአንዱ በተለይም በተመረጠው መሰረት አንድ የተወሰነ ግብ ሲደረስ እንደፍላጎቱ ሊከናወን ይችላል፡
- በመጀመሪያ ደረጃ የትኞቹ ጽሑፎች የኮርፐስ መሰረት እንደሚሆኑ ይወሰናል። ለተግባራዊ ዓላማዎች, የጋዜጠኝነት, የጋዜጣ ቁሳቁሶች, የበይነመረብ አስተያየቶች ብዙ ጊዜ ጥቅም ላይ ይውላሉ. በምርምር ፕሮጀክቶች ውስጥ, በጣምየተለያዩ አይነት ኮርፖራዎች፣ ነገር ግን ጽሑፎቹ በተወሰነ የጋራ መሰረት መመረጥ አለባቸው።
- የተገኘው የጽሑፍ ስብስብ አስቀድሞ ተዘጋጅቷል፣ስህተቶቹ ተስተካክለዋል፣ ካለ፣ የጽሑፉ መጽሐፍ ቅዱሳዊ እና ከቋንቋ ውጭ የሆነ መግለጫ ተዘጋጅቷል።
- ጽሑፋዊ ያልሆኑ መረጃዎች በሙሉ ተጣርተዋል፡ ግራፊክስ፣ ሥዕሎች፣ ሠንጠረዦች ተሰርዘዋል።
- ቶከኖች፣ ብዙ ጊዜ ቃላት፣ ለቀጣይ ሂደት ይመደባሉ::
- በመጨረሻ፣ morphological፣ syntactic እና ሌሎች የንጥረ ነገሮች ስብስብ ምልክት ማድረጊያ ይከናወናል።
የሁሉም የተከናወኑ ተግባራት ውጤት በውስጡ የተከፋፈሉ የንጥረ ነገሮች ስብስብ ያለው የተዋሃደ መዋቅር ነው፣ ለእያንዳንዳቸው የንግግር፣ ሰዋሰዋዊ እና አንዳንድ ጊዜ የትርጉም ባህሪያት ይገለጻሉ።
ጉዳዮችን ለመፍጠር አስቸጋሪዎች
አንድ ኮርፐስ ለማግኘት ብዙ ቃላትን ወይም አረፍተ ነገሮችን አንድ ላይ ማሰባሰብ በቂ እንዳልሆነ መረዳት አስፈላጊ ነው። በአንድ በኩል, የጽሁፎች ስብስብ ሚዛናዊ መሆን አለበት, ማለትም, የተለያዩ አይነት ጽሑፎችን በተወሰኑ መጠኖች ያቅርቡ. በሌላ በኩል የጉዳዩ ይዘት በልዩ መንገድ ምልክት መደረግ አለበት።
የመጀመሪያው ጉዳይ በስምምነት ነው የሚፈታው፡ ለምሳሌ ስብስቡ 60% ልብ ወለድ ጽሑፎችን፣ 20% ዘጋቢ ፊልሞችን ያካትታል፣ የተወሰነ ድርሻ የተሰጠው የቃል ንግግር፣ የህግ አውጭ ድርጊቶች፣ ሳይንሳዊ ወረቀቶች ወዘተ በጽሁፍ ለማቅረብ ነው። ዛሬ ሚዛናዊ የሆነ ኮርፐስ የሚሆን ምርጥ የምግብ አሰራር የለም።
የይዘት ማርክን በተመለከተ ሁለተኛው ጥያቄ ለመፍታት የበለጠ ከባድ ነው። ለጽሑፎች አውቶማቲክ ማርክ ጥቅም ላይ የሚውሉ ልዩ ፕሮግራሞች እና ስልተ ቀመሮች አሉ ነገር ግን 100% ውጤት አይሰጡም, ውድቀቶችን ሊያስከትሉ እና በእጅ ማጣራት ያስፈልጋቸዋል. ይህንን ችግር ለመፍታት እድሎች እና ችግሮች በ V. P. Zakharov ስለ ኮርፐስ ሊንጉስቲክስ ስራ ላይ በዝርዝር ተገልጸዋል።
የጽሑፍ ምልክት ማድረጊያ በተለያዩ ደረጃዎች ይከናወናል፣እነሱም ከዚህ በታች እንዘረዝራለን።
የሞርፎሎጂ ምልክት
ከትምህርት ቤት አግዳሚ ወንበር ላይ, በሩሲያ ቋንቋ ውስጥ የተለያዩ የንግግር ክፍሎች እንዳሉ እናስታውሳለን, እና እያንዳንዳቸው የራሳቸው ባህሪያት አላቸው. ለምሳሌ፣ ግስ ስም የሌለው የስሜትና ውጥረት ምድቦች አሉት። ተወላጅ ተናጋሪው ስሞችን አይቀበልም እና ግሦችን ያለምንም ማመንታት ያጣምራል፣ ነገር ግን የእጅ ሥራ 100 ሚሊዮን የቃላት አጠቃቀምን ኮርፐስ ለማመልከት ተስማሚ አይደለም። ሁሉም አስፈላጊ ስራዎች በኮምፒዩተር ሊከናወኑ ይችላሉ, ነገር ግን ለዚህ ማስተማር ያስፈልገዋል.
ኮምፒዩተሩ እያንዳንዱን ቃል እንደ አንዳንድ ሰዋሰው ባህሪያት እንደ አንዳንድ የንግግር ክፍል "እንዲረዳው" የሞርፎሎጂ ምልክት ማድረግ አስፈላጊ ነው። ብዙ መደበኛ ህጎች በሩሲያኛ (እንደማንኛውም) ቋንቋ ስለሚሠሩ ብዙ ስልተ ቀመሮችን በማሽኑ ውስጥ በማስገባት ለሞርሞሎጂ ትንተና አውቶማቲክ ሂደት መገንባት ይቻላል ። ሆኖም ግን, ለደንቡ ልዩ ሁኔታዎች, እንዲሁም የተለያዩ ውስብስብ ነገሮች አሉ. በውጤቱም ፣ የኮምፒዩተር ንፁህ ትንተና ዛሬ በጣም ጥሩ አይደለም ፣ እና 4% ስህተቶች እንኳን 4 ሚሊዮን ቃላት በ 100 ሚሊዮን ዩኒት ኮርፐስ ውስጥ ይሰጣሉ ፣ ይህም በእጅ ማጣራት ይፈልጋል።
ይህ ችግር በV. P. Zakharov "Corpus Linguistics" መጽሐፍ በዝርዝር ተገልፆአል።
አገባብ ምልክት
አገባብ ትንተና ወይም መተንተን በአረፍተ ነገር ውስጥ ያለውን የቃላት ግንኙነት የሚወስን ሂደት ነው። በአልጎሪዝም ስብስብ እርዳታ በጽሑፉ ውስጥ ርዕሰ-ጉዳዩን, ተሳቢዎችን, ተጨማሪዎችን እና የተለያዩ የንግግር ዘይቤዎችን መወሰን ይቻላል. በቅደም ተከተል ውስጥ የትኞቹ ቃላቶች ዋና እንደሆኑ እና የትኞቹ ጥገኛ እንደሆኑ በመለየት መረጃን ከጽሑፉ ላይ በብቃት ማውጣት እና ማሽኑ ለፍለጋ ጥያቄ ምላሽ የምንፈልገውን መረጃ ብቻ እንዲመልስ ማሰልጠን እንችላለን።
በነገራችን ላይ፣ ዘመናዊ የፍለጋ ፕሮግራሞች “በፖም ውስጥ ስንት ካሎሪዎች አሉ” ወይም “ከሞስኮ እስከ ሴንት ፒተርስበርግ ያለው ርቀት” ለሚሉት አግባብነት ላላቸው ጥያቄዎች ምላሽ ከረጅም ፅሁፎች ይልቅ የተወሰኑ ቁጥሮች ለመስጠት ይህንን ይጠቀማሉ። ነገር ግን፣ የተገለፀውን ሂደት መሰረታዊ ነገሮች እንኳን ለመረዳት በ"Copus Linguistics መግቢያ" ወይም ሌላ መሰረታዊ የመማሪያ መጽሀፍ እራስዎን ማወቅ ያስፈልግዎታል።
የፍቺ ምልክት
የአንድ ቃል ፍቺ በቀላል አነጋገር ትርጉሙ ነው። በትርጉም ትንተና ውስጥ በሰፊው የሚተገበር አቀራረብ የትርጓሜ ምድቦች እና ንዑስ ምድቦች ስብስብ መሆኑን የሚያንፀባርቅ መለያዎች ለአንድ ቃል መለያ መስጠት ነው። እንዲህ ዓይነቱ መረጃ የጽሑፍ ስሜትን ትንተና ስልተ ቀመሮችን ለማመቻቸት፣ አውቶማቲክ ማጣቀሻ እና ኮርፐስ የቋንቋ ዘዴዎችን በመጠቀም ሌሎች ተግባራትን ለማከናወን ጠቃሚ ነው።
ቁጥራቸው የዛፉ "ሥሮች" አሉ፣ እነሱም ያሏቸው ረቂቅ ቃላት ናቸው።በጣም ሰፊ ትርጓሜዎች. እንደ እነዚህ የዛፍ ቅርንጫፎች ፣ አንጓዎች የበለጠ እና የበለጠ የተወሰኑ የቃላት አጠቃቀሞችን ያካተቱ ናቸው ። ለምሳሌ "ፍጥረት" የሚለው ቃል እንደ "ሰው" እና "እንስሳ" ካሉ ጽንሰ-ሐሳቦች ጋር ሊዛመድ ይችላል. የመጀመሪያው ቃል ወደ ተለያዩ ሙያዎች፣ የዝምድና ውሎች፣ ዜግነት፣ እና ሁለተኛው - ወደ ክፍል እና የእንስሳት ዓይነቶች መከፋፈሉን ይቀጥላል።
የመረጃ ማግኛ ስርዓቶች አጠቃቀም
የኮርፐስ ሊንጉስቲክስ አጠቃቀም ዘርፎች የተለያዩ የእንቅስቃሴ ዘርፎችን ይሸፍናሉ። ኮርፖራ መዝገበ ቃላትን ለማጠናቀር እና ለማረም ፣ አውቶማቲክ የትርጉም ሥርዓቶችን ለመፍጠር ፣ ለማጠቃለል ፣ እውነታዎችን ለማውጣት ፣ ስሜትን ለመወሰን እና ሌሎች የጽሑፍ ማቀነባበሪያዎችን ለማካሄድ ያገለግላሉ።
በተጨማሪም እንደዚህ ያሉ ሀብቶች የአለምን ቋንቋዎች እና የቋንቋውን አጠቃላይ የአሠራር ዘዴዎች በማጥናት በንቃት ጥቅም ላይ ይውላሉ። ከፍተኛ መጠን ያለው ቅድመ ዝግጅት የተደረገ መረጃ ማግኘት ለቋንቋዎች እድገት አዝማሚያዎች ፈጣን እና አጠቃላይ ጥናት ፣የኒዮሎጂስቶች ምስረታ እና የተረጋጋ የንግግር መዞር ፣ የቃላት አሃዶች ትርጉም ለውጦች ፣ ወዘተ.
አስተዋጽኦ ያደርጋል።
ከእንደዚህ አይነት ትልቅ መጠን ያለው መረጃ ጋር መስራት አውቶሜትሽን ስለሚያስፈልገው ዛሬ በኮምፒውተር እና በኮርፐስ ሊንጉስቲክስ መካከል የቅርብ መስተጋብር አለ።
የሩሲያ ቋንቋ ብሔራዊ ኮርፐስ
ይህ ኮርፐስ (በአህጽሮቱ NKRC) ንብረቱን በመጠቀም የተለያዩ ተግባራትን ለመፍታት የሚያስችሉ በርካታ ንዑስ ኮርፐሶችን ያካትታል።
ቁሳቁሶች በNCRA ዳታቤዝ ውስጥ በሚከተሉት ይከፈላሉ፡
- በ90ዎቹ እና 2000ዎቹ ሚዲያ ላይ ህትመቶች ላይዓመታት፣ የሀገር ውስጥም ሆነ የውጭ፣
- የቃል ንግግር ቅጂዎች፤
- በአክሰንቶሎጂ ምልክት የተደረገባቸው ጽሑፎች (ማለትም በድምፅ ምልክቶች)፤
- የቋንቋ ንግግር፤
- የግጥም ስራዎች፤
- ቁሶች ከአገባብ ማርክ ጋር፣ወዘተ
የመረጃ ስርዓቱ ከሩሲያኛ ወደ እንግሊዘኛ፣ ጀርመንኛ፣ ፈረንሳይኛ እና ሌሎች በርካታ ቋንቋዎች (እና በተገላቢጦሽ) ትይዩ የሆኑ የስራ ትርጉሞች ያላቸውን ንዑስ ኮርፐስ ያካትታል።
እንዲሁም የመረጃ ቋቱ በተለያዩ የዕድገት ጊዜያት ውስጥ በሩሲያኛ የተፃፈ ንግግርን የሚወክሉ የታሪክ ጽሑፎች ክፍል አለው። የሩሲያ ቋንቋን በመማር ረገድ ለውጭ ዜጎች ጠቃሚ ሊሆን የሚችል የስልጠና ኮርፐስ አለ።
የሩሲያ ቋንቋ ብሔራዊ ኮርፐስ 400 ሚሊዮን የቃላት አሃዶችን ያካትታል እና በብዙ መልኩ ከአውሮፓ ቋንቋዎች ኮርፖራ ጉልህ ክፍል ቀድሟል።
ተስፋዎች
ይህን አካባቢ ተስፋ ሰጭ መሆኑን ለመገንዘብ የሚጠቅመው እውነታ በሩሲያ ዩኒቨርስቲዎች ውስጥ ያሉ ኮርፐስ የቋንቋ ላብራቶሪዎች እንዲሁም በውጪ ሀገራት መኖራቸው ነው። በታሰቡ የመረጃ ማግኛ ሀብቶች ማዕቀፍ ውስጥ ጥቅም ላይ እና ምርምር ፣ በከፍተኛ ቴክኖሎጂ መስክ የአንዳንድ አካባቢዎች ልማት ፣ የጥያቄ-መልስ ሥርዓቶች ተያይዘዋል ፣ ግን ይህ ከላይ ተብራርቷል።
የበለጠ የኮርፐስ ሊንጉስቲክስ እድገት በሁሉም ደረጃዎች ከቴክኒካል ጀምሮ አዳዲስ ስልተ ቀመሮችን በማስተዋወቅ መረጃን የመፈለግ እና የማቀናበር ሂደትን የሚያመቻቹ ፣የኮምፒዩተሮችን አቅም በማስፋፋት ፣ኦፕሬሽንን በመጨመር ይተነብያል።ማህደረ ትውስታ፣ እና በቤተሰብ አባላት ያበቃል፣ ተጠቃሚዎች ይህን አይነት ግብአት በዕለት ተዕለት ህይወት እና በስራ ቦታ የሚጠቀሙባቸው ብዙ እና ብዙ መንገዶችን ስለሚያገኙ።
በማጠቃለያ
በባለፈው ክፍለ ዘመን አጋማሽ 2017 የጠፈር መንኮራኩሮች የአጽናፈ ሰማይን እና ሮቦቶችን ለሰዎች የሚሰሩትን ስራ የሚሰሩበት የሩቅ ጊዜ ይመስላል። እንደ እውነቱ ከሆነ ግን ሳይንስ “ባዶ ቦታዎች” የተሞላ ነው እና የሰው ልጅን ለዘመናት ሲያስጨንቁ የነበሩ ጥያቄዎችን ለመመለስ ተስፋ የቆረጡ ሙከራዎችን እያደረገ ነው። የቋንቋው አሠራር ጥያቄዎች እዚህ ቦታ ይኮራሉ፣ እና ኮርፐስ እና ኮምፒውቲሽናል ሊንጉስቲክስ እነሱን እንድንመልስ ሊረዱን ይችላሉ።
ከፍተኛ መጠን ያለው ውሂብን ማካሄድ ከዚህ ቀደም ሊደረስባቸው የማይችሉ ቅጦችን እንድታገኝ፣ የአንዳንድ የቋንቋ ባህሪያትን እድገት ለመተንበይ፣ የቃላትን አፈጣጠር በእውነተኛ ሰዓት እንድትከታተል ያስችልሃል።
በተግባራዊ አለምአቀፍ ደረጃ ኮርፖራ ተደርጎ ሊወሰድ ይችላል ለምሳሌ የህዝብን ስሜት ለመገምገም እንደ መሳሪያ ሊሆን ይችላል - በይነመረብ በተከታታይ በእውነተኛ ተጠቃሚዎች የተፈጠሩ የተለያዩ ፅሁፎች ዳታቤዝ ነው እነዚህ አስተያየቶች ፣ ግምገማዎች ፣ መጣጥፎች ናቸው ። ፣ እና ሌሎች ብዙ የንግግር ዓይነቶች።
በተጨማሪም ከኮርፖራ ጋር አብሮ መስራት በመረጃ ማግኛ ላይ የሚሳተፉትን ከጎግል ወይም ከ Yandex አገልግሎቶች፣ ከማሽን ትርጉም፣ ከኤሌክትሮኒካዊ መዝገበ-ቃላት የምናውቃቸው ተመሳሳይ ቴክኒካል መንገዶችን ለማዳበር አስተዋፅኦ ያደርጋል።
የ ኮርፐስ ሊንጉስቲክስ የመጀመሪያ እርምጃዎቹን ብቻ እየሰራ ነው እና በቅርብ ጊዜ ውስጥ በፍጥነት እያደገ ነው ብሎ በእርግጠኝነት መናገር አይቻልም።