Linux Regular Expressions គឺជាតួអក្សរពិសេសដែលជួយស្វែងរកទិន្នន័យ និងផ្គូផ្គងលំនាំស្មុគស្មាញ។ កន្សោមធម្មតាត្រូវបានខ្លីជា 'regexp' ឬ 'regex' ។ ពួកវាត្រូវបានប្រើនៅក្នុងកម្មវិធីលីនុចជាច្រើនដូចជា grep, bash, rename, sed ជាដើម។
តើអ្វីជាកន្សោមធម្មតានៅក្នុងយូនីក?
កន្សោមធម្មតាគឺ លំនាំដែលមានលំដាប់នៃតួអក្សរដែលត្រូវគ្នានឹងអត្ថបទ. UNIX វាយតំលៃអត្ថបទទល់នឹងលំនាំដើម្បីកំណត់ថាតើអត្ថបទនិងលំនាំត្រូវគ្នាឬអត់។ … ឧបករណ៍ប្រើប្រាស់យូនីកដ៏មានឥទ្ធិពលបំផុតមួយចំនួន ដូចជា grep និង sed ប្រើកន្សោមធម្មតា។
តើអ្វីជាកន្សោមធម្មតានៅក្នុងសែល?
កន្សោមធម្មតា (regex) គឺ វិធីសាស្រ្តតំណាងឱ្យលំនាំផ្គូផ្គងខ្សែអក្សរ. កន្សោមធម្មតាអាចឱ្យខ្សែអក្សរដែលត្រូវគ្នានឹងលំនាំជាក់លាក់មួយនៅក្នុងកំណត់ត្រាទិន្នន័យអត្ថបទដើម្បីឱ្យមានទីតាំង និងកែប្រែ ហើយពួកវាត្រូវបានគេប្រើជាញឹកញាប់នៅក្នុងកម្មវិធីឧបករណ៍ប្រើប្រាស់ និងភាសាសរសេរកម្មវិធីដែលគ្រប់គ្រងទិន្នន័យអត្ថបទ។
តើអ្វីជាកន្សោមធម្មតាជាមូលដ្ឋាន?
តួអក្សរអក្សរសាស្ត្រ
កន្សោមធម្មតាជាមូលដ្ឋានបំផុតមាន ព្យញ្ជនៈតែមួយដូចជា ក. វាត្រូវគ្នានឹងការកើតឡើងដំបូងនៃតួអក្សរនោះនៅក្នុងខ្សែអក្សរ។ … នៅក្នុងភាសាសរសេរកម្មវិធី ជាធម្មតាមានមុខងារដាច់ដោយឡែកមួយដែលអ្នកអាចហៅទៅបន្តការស្វែងរកតាមរយៈខ្សែអក្សរបន្ទាប់ពីការប្រកួតមុន។
តើអ្វីជាប្រភេទផ្សេងគ្នានៃកន្សោមធម្មតា?
អាតូមកន្សោមធម្មតា។
- តួអក្សរតែមួយ។ តួអក្សរតែមួយដែលមិនមានសារៈសំខាន់ពិសេសតំណាងឱ្យតួអក្សរនោះនៅក្នុងខ្សែអក្សរគោលដៅ។ …
- កាតព្រៃ។ នេះ។ …
- កន្សោមតង្កៀប។ …
- គ្រប់គ្រងតួអក្សរ។ …
- សំណុំតួអក្សររត់គេច។ …
- យុថ្កា។ …
- ការពង្រីកឡើងវិញ។
ហេតុអ្វីបានជាគេហៅថាការបញ្ចេញមតិធម្មតា?
កន្សោមធម្មតាតាមដានការងាររបស់គណិតវិទូជនជាតិអាមេរិកឈ្មោះ Stephen Kleene (ជាឥស្សរជនដែលមានឥទ្ធិពលបំផុតក្នុងការអភិវឌ្ឍន៍ទ្រឹស្តីវិទ្យាសាស្ត្រកុំព្យូទ័រ) ដែលបានបង្កើតកន្សោមធម្មតាជាសញ្ញាណសម្រាប់ការពិពណ៌នាអំពីអ្វីដែលគេហៅថា "ពិជគណិតនៃសំណុំធម្មតា” ការងាររបស់គាត់នៅទីបំផុត…
តើពាក្យបញ្ជា grep មួយណានឹងបង្ហាញលេខដែលមានលេខ 4 ឬច្រើនខ្ទង់?
ជាពិសេស៖ [0-9] ត្រូវនឹងខ្ទង់ណាមួយ (ដូចជា [[:digit:]] ឬ d ក្នុងកន្សោមធម្មតា Perl) និង {4} មានន័យថា “បួនដង”។ ដូច្នេះ [0-9]{4} ត្រូវនឹងលំដាប់បួនខ្ទង់។ [^0-9] ផ្គូផ្គងតួអក្សរមិននៅក្នុងជួរពី 0 ដល់ 9 ។ វាស្មើនឹង [^[:digit:]] (ឬ D ក្នុងកន្សោមធម្មតា Perl)។
តើពាក្យ grep មានន័យដូចម្តេច?
នៅក្នុងពាក្យសាមញ្ញបំផុត grep (ការបោះពុម្ពកន្សោមធម្មតាជាសកល) គឺជាក្រុមនៃពាក្យបញ្ជាតូចមួយដែលស្វែងរកឯកសារបញ្ចូលសម្រាប់ខ្សែអក្សរស្វែងរក ហើយបោះពុម្ពបន្ទាត់ដែលត្រូវនឹងវា។ … ចំណាំថាគ្មានកន្លែងណានៅក្នុងដំណើរការនេះមិនធ្វើ grep ផ្ទុកបន្ទាត់ ផ្លាស់ប្តូរបន្ទាត់ ឬស្វែងរកតែផ្នែកមួយនៃបន្ទាត់នោះទេ។
តើអ្វីទៅជាការអនុវត្តកន្សោមធម្មតា?
កម្មវិធីទូទៅរួមមាន សុពលភាពទិន្នន័យ ការបំបែកទិន្នន័យ (ជាពិសេសការបំបែកគេហទំព័រ) ការឈ្លោះប្រកែកគ្នាទិន្នន័យ ការញែកសាមញ្ញ ការផលិតប្រព័ន្ធបន្លិចវាក្យសម្ព័ន្ធនិងការងារជាច្រើនទៀត។
តើអ្វីទៅជាទម្រង់នៃកន្សោមធម្មតាពីរដែលប្រើនៅក្នុងលីនុច?
វាក្យសម្ព័ន្ធកន្សោមធម្មតាមានបីកំណែ៖
- BRE៖ កន្សោមធម្មតាជាមូលដ្ឋាន។
- ERE៖ កន្សោមធម្មតាដែលបានពង្រីក។
- PRCE: កន្សោមទៀងទាត់ Perl ។