የድግግሞሽ ጽሑፍ ትንተና፡ ባህሪያት እና ምሳሌዎች

ዝርዝር ሁኔታ:

የድግግሞሽ ጽሑፍ ትንተና፡ ባህሪያት እና ምሳሌዎች
የድግግሞሽ ጽሑፍ ትንተና፡ ባህሪያት እና ምሳሌዎች
Anonim

ከጽሁፎች ጋር መስራት ካለብህ በህይወትህ ይህን ጽንሰ ሃሳብ ከአንድ ጊዜ በላይ አግኝተሃል። በተለይም የጽሑፉን ድግግሞሽ ትንተና ወደሚያካሂዱ የመስመር ላይ ካልኩሌተሮች ማዞር ትችላለህ። እነዚህ ምቹ መሳሪያዎች በማንኛውም የጽሑፍ ምንባብ ውስጥ አንድ ቁምፊ ወይም ፊደል ምን ያህል ጊዜ እንደሚከሰት ያሳያሉ። ብዙውን ጊዜ መቶኛ እንዲሁ ይታያል። ይህ ለምን አስፈለገ? የጽሑፍ ድግግሞሽ ትንተና ለቀላል ምስጢሮች “መሰነጣጠቅ” አስተዋፅዖ የሚያደርገው እንዴት ነው? ዋናው ነገር ምንድን ነው ፣ ማን ፈጠረው? በርዕሱ ላይ እነዚህን እና ሌሎች አስፈላጊ ጥያቄዎችን በአንቀጹ ሂደት ውስጥ እንመልሳለን።

ፍቺ

የድግግሞሽ ትንተና ከክሪፕቶናሊሲስ ዓይነቶች አንዱ ነው። እሱ በሳይንቲስቶች ግምት ላይ የተመሰረተ የግለሰብ ገጸ-ባህሪያት ስታትስቲካዊ ቀላል ያልሆነ ስርጭት እና የእነሱ መደበኛ ቅደም ተከተሎች በሁለቱም በግልፅ እና በምስክር ጽሑፍ ውስጥ።

እንዲህ ዓይነቱ ስርጭት፣ የነጠላ ቁምፊዎችን መተካት ድረስ፣ እንዲሁ በምስጠራ/መግለጽ ሂደቶች ውስጥ እንደሚቀመጥ ይታመናል።

የስርዓቶች ድግግሞሽ ትንተና
የስርዓቶች ድግግሞሽ ትንተና

የሂደት ባህሪ

አሁን የፍሪኩዌንሲ ትንታኔን በቀላል አነጋገር እንይ። ይህ የሚያሳየው በቂ ርዝመት ባላቸው ፅሁፎች ውስጥ ያሉት ተመሳሳይ የፊደል ገፀ-ባህሪያት ክስተቶች ብዛት በተመሳሳይ ቋንቋ በተፃፉ የተለያዩ ጽሑፎች ላይ ተመሳሳይ ነው።

እና አሁን ስለ ነጠላ ፊደል ምስጠራስ? በምስጢር ጽሑፍ ክፍል ውስጥ እንደዚህ ያለ ተመሳሳይ የመከሰት እድል ያለው ገጸ ባህሪ ካለ፣ ያ የተመሰጠረ ፊደል ነው ብሎ መገመት እውነት ነው።

የድግግሞሽ ጽሑፍ ትንተና ተከታዮች ተመሳሳይ ምክንያትን በዲግራም (የሁለት ፊደሎች ቅደም ተከተል) ይተገብራሉ። ትሪግራም - ይህ አስቀድሞ ፖሊፊፋቤቲክ ምስጢሮች ጉዳይ ነው።

የዘዴው ታሪክ

የቃላት ድግግሞሽ ትንተና የዘመናዊነት ግኝት አይደለም። ከ 9 ኛው ክፍለ ዘመን ጀምሮ በሳይንስ ዓለም ዘንድ ይታወቃል. አፈጣጠሩ ከአል-ኪንዲ ስም ጋር የተያያዘ ነው።

ነገር ግን የታወቁት የድግግሞሽ ትንተና ዘዴ አተገባበር ከረጅም ጊዜ በኋላ ነው። እዚህ ላይ በጣም አስደናቂው ምሳሌ በ 1822 በጄ.-ኤፍ. የተሰራው የግብፅ ሂሮግሊፍስ ዲክሪፕት ነው። ሻምፖልዮን።

ወደ ልቦለድ ከሄድን ለዚህ ዲክሪፕት ማድረጊያ ዘዴ ብዙ አስደሳች ማጣቀሻዎችን እናገኛለን፡

  • ኮናን ዶይሌ - "የዳንስ ሰዎች"።
  • Jules Verne - "የካፒቴን ግራንት ልጆች"።
  • Edgar Poe - "Gold Bug"።

ነገር ግን፣ ካለፈው ምዕተ-አመት አጋማሽ ጀምሮ፣ አብዛኛዎቹ ስልተ ቀመሮች ምስጠራ ውስጥ ጥቅም ላይ የዋሉት ለእንደዚህ ያሉ ፍሪኩዌንሲ ክሪፕቶናሊሲስ ያላቸውን ተቃውሞ ግምት ውስጥ በማስገባት ነው። ስለዚህም ነው።ዛሬ ብዙ ጊዜ ጥቅም ላይ የሚውሉት የወደፊት ክሪፕቶግራፈሮችን ለማሰልጠን ብቻ ነው።

የጽሑፍ ድግግሞሽ ትንተና
የጽሑፍ ድግግሞሽ ትንተና

መሠረታዊ ዘዴ

አሁን የድግግሞሽ ምላሽ ትንታኔን በዝርዝር እናቅርብ። የዚህ ዓይነቱ ትንተና በቀጥታ የሚመረኮዘው ፈተናው ቃላቶችን እና እነዚያን ደግሞ ፊደሎችን ያካተተ ነው በሚለው እውነታ ላይ ነው. የሀገር ውስጥ ፊደላትን የሚሞሉ ፊደሎች ብዛት ውስን ነው። ደብዳቤዎች በቀላሉ እዚህ ሊዘረዘሩ ይችላሉ።

የእንዲህ ዓይነቱ ጽሑፍ በጣም አስፈላጊዎቹ ባህሪዎች የፊደሎች ፣ የተለያዩ ቢግራሞች ፣ ትሪግራም እና n-ግራም መደጋገም እንዲሁም የተለያዩ ፊደሎች እርስ በእርስ መጣጣም ፣ የተናባቢዎች / አናባቢዎች መለዋወጥ እና ሌሎችም ይሆናሉ ። የእነዚህ ምልክቶች ዓይነቶች።

የዘዴዎቹ ዋና ሀሳብ ኤን-ግራም (በ nm የተወከለው) ለትንተና በቂ ረጅም ጊዜ ባለው የሐገር ፊደላት (በT=t1t2…tl) የተካተቱት ሊሆኑ የሚችሉ ክስተቶችን መቁጠር ነው። በ{a1, a2, …, an}) ተጠቁሟል። ከላይ ያሉት ሁሉም የጽሑፉን ኤም-ግራም ያስከትላሉ፡

t1t2…tm፣ t2t3… tm+1፣ …፣ ti-m+1tl-m+2…tl.

ይህ የ m-gram ai1ai2 ክስተት ብዛት ከሆነ…በተወሰነ ጽሁፍ ላይ ኢላማ ያድርጉ፣ እና L በተመራማሪው የተተነተነ አጠቃላይ የ m-grams ብዛት ከሆነ፣ በemmpirically ያንን ማረጋገጥ ይቻላል ለ በቂ ትልቅ L፣ የእንደዚህ አይነት m-gram ድግግሞሽ አንዳቸው ከሌላው ትንሽ የሚለያዩ ይሆናሉ።

ድግግሞሽ ትንተና
ድግግሞሽ ትንተና

በተደጋጋሚ የሚከሰቱ የሩሲያ ፊደሎች

ነገር ግን የጊዜ ድግግሞሽ ትንተና ምንም እንኳን ተመሳሳይ ስም ቢኖረውም ከንግግራችን ርዕስ ጋር ምንም ግንኙነት የለውም። እንዲህ ዓይነቱ ትንተና ይካሄዳልልዩ የሞገድ ትራንስፎርሜሽን በመጠቀም ዝቅተኛ ሊታዩ ከሚችሉ ራዳር ጣቢያዎች የሚመጡ ምልክቶች።

አሁን ወደ ዋናው ርዕስ እንመለስ። የድግግሞሽ ትንተና በሚሰሩበት ጊዜ የትኞቹ የሩሲያ ፊደላት ብዙ ጊዜ በተመጣጣኝ መጠን ጽሁፎች ውስጥ እንደሚገኙ ማወቅ ይችላሉ (በመቶኛ ከ 0.062 እስከ 0.018):

  • A.
  • V.
  • D.
  • F.
  • I.
  • ኬ.
  • M.
  • ኦ.
  • R.
  • T.
  • F.
  • T.
  • Sh.
  • b.
  • ኢ.
  • I.

የሩሲያኛ ፊደላትን በጣም የተለመዱ ፊደላትን ለመማር የሚረዳ ልዩ የማሞኒክ ህግ እንኳን ቀርቧል። ይህንን ለማድረግ አንድ ቃል ብቻ ማስታወስ በቂ ነው - "hayloft"።

በአጠቃላይ የፊደላት አጠቃቀም ድግግሞሽ በመቶኛ በቀላሉ ተቀናብሯል፡ ስፔሻሊስቱ ፊደሉ ስንት ጊዜ በፅሁፉ ላይ እንደተከሰተ ይቆጥራል ከዚያም የተገኘውን እሴት በፅሁፉ ውስጥ ባሉት የቁምፊዎች ብዛት ይከፋፍላል። እና ይህን ዋጋ እንደ መቶኛ ለመግለጽ በ100 ማባዛቱ በቂ ነው።

ድግግሞሹ በጽሑፉ መጠን ላይ ብቻ ሳይሆን በባህሪው ላይም እንደሚወሰን ማሰቡ ጠቃሚ ነው። ለምሳሌ በቴክኒካል ምንጮች ውስጥ "ኤፍ" የሚለው ፊደል በልብ ወለድ ውስጥ በጣም ብዙ ጊዜ ይታያል. ስለዚህ፣ ለተጨባጭ ውጤት፣ ልዩ ባለሙያተኛ ለምርምር የተለያዩ ተፈጥሮ እና ዘይቤ ያላቸውን ጽሑፎች መፃፍ አለበት።

የጽሑፍ ድግግሞሽ ትንተና ፕሮግራሞች
የጽሑፍ ድግግሞሽ ትንተና ፕሮግራሞች

Bi-፣ tri-፣ አራት-ግራም

ትርጉም በሚሰጡ ፅሁፎች ውስጥ፣ በጣም የተለመዱትን (በቅደም ተከተላቸው፣ ብዙውን ማግኘት ይችላሉ።ተደጋጋሚ) የሁለት ወይም ከዚያ በላይ ፊደሎች ጥምረት። ስፔሻሊስቶች የተለያዩ ፊደሎችን ተመሳሳይ ንድፎችን ድግግሞሾችን የሚያመለክቱ በርካታ ሰንጠረዦችን ሰብስበዋል::

ሩሲያኛን በተመለከተ፣ ብዙ ትርጉም ያላቸው ጽሑፎች ሲስተሞች ድግግሞሽ ትንተና በጣም የተለመዱ ቢግራሞችን እና ትሪግራሞችን ለመመስረት አስችሎታል፡

  • EN።
  • ST.
  • ግን።
  • አይደለም።
  • በርቷል።
  • RA።
  • OV.
  • KO።
  • VO.
  • STO።
  • አዲስ
  • ኢኖ።
  • TOV።
  • OVA።
  • OVO።

የተመረጡት የፊደላት ግንኙነቶች እርስ በርሳቸው

እና ይህ የፍሪኩዌንሲ ትንተና ለጽሑፍ ተመራማሪዎች የሚያቀርባቸው ሁሉም እድሎች አይደሉም። ከተመሳሳይ የቢግራም እና ትሪግራም ሰንጠረዦች መረጃን በስርዓት በማዘጋጀት በጣም በተለመዱት የፊደላት ጥምሮች ላይ መረጃን ማውጣት ይቻላል ። ወይም፣ በሌላ አነጋገር፣ እርስ በርስ የሚወዷቸው ግንኙነቶች።

እንዲህ ዓይነቱ ሰፊ ጥናት አስቀድሞ በባለሙያዎች ተካሂዷል። ውጤቱም ከእያንዳንዱ የፊደል ገበታ ጋር ጎረቤቶቹ የሚያመለክቱበት ጠረጴዛ ነበር። ከዚህም በላይ, ከሱ በፊት እና ከእሱ በኋላ ወዲያውኑ የተገኙት እነዚህ ገጸ-ባህሪያት. በሠንጠረዡ ውስጥ ያሉት ፊደላት በአጋጣሚ የተጻፉ አይደሉም። ወደ ምልክቱ በቅርበት፣ በጣም ተደጋጋሚ ጎረቤቶች ይጠቁማሉ፣ ተጨማሪ - በጣም አልፎ አልፎ።

ምሳሌዎችን ተመልከት፡

  • ፊደል "ሀ"። የሚከተሉት ተመራጭ ግንኙነቶች እዚህ ተለይተዋል-l-d-k-t-v-r-n-A-l-n-s-t-r-v-to-m. ከዚህ በመነሳት ብዙ ጊዜ ከ"ሀ" በፊት በጽሁፎቹ ውስጥ "H" ("NA") እንዳለ እናያለን። እና ከ "A" በኋላ ብዙ ጊዜ በሩሲያኛ ጽሑፎች ውስጥ "L" ን ማግኘት እንችላለን("AL")።
  • ፊደል "M"። ባለሙያዎች እንደዚህ ያሉ ተመራጭ ግንኙነቶችን ለይተው አውቀዋል፡ "I-s-a-i-e-o-M-i-e-o-u-a-n-p-s"
  • ፊደል "ለ"። ተመራጭ ግንኙነቶች እንደሚከተለው ናቸው፡ "n-s-t-l-b-n-k-v-p-s-e-o-i"።
  • ደብዳቤ "ሽ"። ተመራጭ ግንኙነቶች፡ "e-b-a-i-u-Sch-e-i-a"።
  • ፊደል "P"። ከዚህ የሩስያ ፊደላት ምልክት ጋር የተመረጡ ግንኙነቶች "v-s-u-a-i-e-o-P-o-r-e-a-u-i-l".
የጊዜ ድግግሞሽ ትንተና
የጊዜ ድግግሞሽ ትንተና

ትንተና ምን ይገለጻል?

ዘመናዊ የፍሪኩዌንሲ ጽሑፍ ትንተና ፕሮግራሞች ሰፊ መጠን ያላቸውን የተለያዩ መጣጥፎችን፣ ድርሰቶችን፣ ምንባቦችን እና የመሳሰሉትን ለማጥናት ይረዳሉ። የሚከተለው መረጃ ለተመራማሪው እንደ መስፈርት ይሰጣል፡

  • በጽሁፉ ውስጥ ያሉ የቁምፊዎች ጠቅላላ ብዛት።
  • ጸሃፊው የተጠቀሙባቸው የቦታዎች ብዛት።
  • የአሃዞች ብዛት።
  • ስለ ያገለገሉ ሥርዓተ-ነጥብ ምልክቶች - ነጥቦች፣ ነጠላ ሰረዞች፣ ወዘተ መረጃ።
  • የፊደሎች ብዛት በእያንዳንዱ የሚገኙት ፊደላት - ሲሪሊክ፣ ላቲን፣ ወዘተ።
  • በጽሁፉ ውስጥ ስላለው የእያንዳንዱ ፊደል እና የምልክት አጠቃቀም ድግግሞሽ መረጃ - የተጠቀሰው ብዛት እና መቶኛ ከጠቅላላው ጽሑፍ ጋር ሲነጻጸር።

ከመጠን በላይ ማመቻቸትን እና ከመጠን በላይ መጨመርን በመቃወም ትግል

የጽሁፍ ድግግሞሽ ትንተና ለምን ይከናወናል? ለፍላጎት ዓላማ ብቻ ነው - በተፃፈው ጽሑፍ ውስጥ የትኞቹ ቁምፊዎች ተደጋግመው እንደተገናኙ ለማወቅ? አይ፣ ዋናው የትንተና አተገባበር ተግባራዊ ነው፣ እና እሱ ሌላ ቦታ ነው።

N-ግራሞች የተረጋጉ ቢግራሞችን እና ትሪግራሞችን ብቻ ያካትታሉ። ወደ ተመሳሳይምድቦች ቁልፍ ቃላትን (መለያዎችን) ፣ ስብስቦችን ያካትታሉ። ማለትም ሁለት ወይም ከዚያ በላይ ቃላትን ያቀፈ የተረጋጋ ጥምረት። እነሱ የሚለዩት እንደዚህ ያሉ ጥንቅሮች በጽሁፉ ውስጥ አንድ ላይ በመሆናቸው እና በተመሳሳይ ጊዜ የተወሰነ የትርጉም ጭነት ስለሚሸከሙ ነው።

ይህ የሚጫወተው ህሊና ቢስ በሆኑ የሶኢኦ ስፔሻሊስቶች እጅ ነው። በስራቸው ውስጥ የአንድን የተወሰነ ድረ-ገጽ ጠቀሜታ በሰው ሰራሽ በሆነ መንገድ ለመጨመር አንዳንድ ጊዜ በጽሑፉ ውስጥ የመለያዎችን እና የቁልፍ ቃላትን መደጋገም አላግባብ ይጠቀማሉ። ስርዓቱን እንዲህ ባለው "ማታለል" ለማታለል እየሞከሩ ነው-የሩሲያ ቋንቋ ባህላዊ ("የማይንክ ኮት ይግዙ") ከተለመዱት የቃላት ጥምረት ጋር የተፈጥሮ ጥምረት ወደ ወጥነት ወደሌለው መለወጥ. ያም ማለት እንደዚህ ባለው የተፈጥሮ ኤን-ግራም ቃላትን በማስተካከል ("ማይንክ ኮት ይግዙ")።

ግን ዛሬ የፍለጋ ስልተ ቀመሮች ከመጠን በላይ ማትባትን ልክ እንደ ስፓም - በቁልፍ ቃላት ከመጠን በላይ መሞላት ፣ በፍለጋ ገጹ ላይ የውጤቶች ደረጃ ላይ ተጽዕኖ የሚያሳድሩ መለያዎች ተምረዋል። ከመጠን በላይ የተመቻቹ ገፆች አሁን በተቃራኒው በተጠቃሚው ጥያቄ ዝቅተኛ ደረጃ ላይ ተቀምጠዋል። እና ሰዎች እራሳቸው ትርጉም የለሽ የማንበብ ዝንባሌ የላቸውም፣ በታግ ጽሑፍ ተሞልተው፣ በሌላ የመረጃ ምንጭ ላይ ጠቃሚ መረጃን ይመርጣሉ።

ድግግሞሽ ትንተና ዘዴ
ድግግሞሽ ትንተና ዘዴ

የግል ትንታኔን ለ SEO ስፔሻሊስቶች ማገዝ

በመሆኑም የዘመናዊ የፍለጋ ሞተር ጽሑፍ ማጣሪያዎች ለእነዚያ የኢንተርኔት ገፆች ምርጫን ይሰጣሉ፣ መረጃው ለማንበብ ቀላል ብቻ ሳይሆን ለጎብኚዎችም ጠቃሚ ነው። ለአዳዲስ ደረጃዎች ስራቸውን ለማመቻቸት, SEO ስፔሻሊስቶችእና ወደ ጽሁፉ ድግግሞሽ ትንተና ዞር. ዛሬ ብዙ ታዋቂ አገልግሎቶች ይሰጣሉ።

የድግግሞሽ ትንተና ለመረጃነት ሲባል ለሕትመት እየተዘጋጀ ያለውን ጽሑፍ ለመገምገም ይረዳል። አላስፈላጊ የመለያዎችን እና የቁልፍ ሀረጎችን ድግግሞሽ ያስወግዱ። እንዲሁም በፍለጋ ሞተሮች የጽሑፍ ማጣሪያዎች ውስጥ ጥርጣሬን የሚቀሰቅሱ ተፈጥሯዊ ባልሆኑ የቃላት ጥምረት ላይ የጸሐፊውን ትኩረት ለመሳብ ያስችልዎታል።

ድግግሞሽ ምላሽ ትንተና
ድግግሞሽ ምላሽ ትንተና

የጽሁፉ ድግግሞሽ ትንተና ስለዚህ የአንድ የተወሰነ ገጸ ባህሪ በምንጩ ውስጥ የሚጠቀሰውን ድግግሞሽ ለማወቅ ይረዳል። ዘዴው ዛሬ ጥቅም ላይ የሚውለው የጽሑፍ ከመጠን በላይ መጫኑን በመለያዎች፣ ከተፈጥሮ ውጪ የሆኑ የቃላት መለዋወጥን ለመገምገም ነው።

የሚመከር: