Porteren
实现 StemmerInterfacePorter 英语词干提取类。
此类改编自 Richard Heyes 编写的类。请参阅上面的版权和链接信息。
自 |
1.0 |
---|---|
包 |
Joomla 框架 |
方法
cvc
检查结尾的 CVC 序列,其中第二个 C 不是 W、X 或 Y
cvc( str) :
自 |
1.0 |
---|
参数
- str
string
要检查的字符串
响应
bool
结果
doubleConsonant
如果给定字符串在字符串结尾处包含两个相同的辅音字母,则返回 true/false。
doubleConsonant( str) :
自 |
1.0 |
---|
参数
- str
string
要检查的字符串
响应
bool
结果
m
m() 测量 $str 中辅音序列的数量。如果 c 是辅音序列,v 是元音序列,而 <..> 表示任意存在,
m( str) :
自 |
1.0 |
---|
参数
- str
string
要返回 m 计数的字符串
响应
int
m 计数
replace
用第二个字符串替换第一个字符串,位于字符串结尾处。如果给出第三个参数,则前面的字符串必须至少匹配该 m 计数。
replace( &str, check, repl, m = null) :
自 |
1.0 |
---|
参数
- str
string
要检查的字符串- check
string
要检查的结尾- repl
string
替换字符串- m
int
可选的最小 m() 数量
响应
bool
$check 字符串是否位于 $str 字符串的结尾处。True 不一定意味着它被替换了。
stem
用于对词元进行词干提取并返回词根的方法。
stem( token, lang) :
自 |
1.0 |
---|
参数
- token
string
要进行词干提取的词元。- lang
string
词元的语言。
响应
string
词根词元。
step1ab
步骤 1
step1ab( word) :
自 |
1.0 |
---|
参数
- word
string
要进行词干提取的词元。
响应
字符串
step1c
步骤 1c
step1c( word) :
自 |
1.0 |
---|
参数
- word
string
要进行词干提取的词元。
响应
字符串
step2
步骤 2
step2( word) :
自 |
1.0 |
---|
参数
- word
string
要进行词干提取的词元。
响应
字符串
step3
步骤 3
step3( word) :
自 |
1.0 |
---|
参数
- word
string
要进行词干提取的词元。
响应
字符串
step4
步骤 4
step4( word) :
自 |
1.0 |
---|
参数
- word
string
要进行词干提取的词元。
响应
字符串
step5
步骤 5
step5( word) :
自 |
1.0 |
---|
参数
- word
string
要进行词干提取的词元。
响应
字符串
属性
cache
已进行词干提取的词元的内部缓存。
自 |
1.0 |
---|
类型
array<string|int, mixed>
regexConsonant
匹配辅音的正则表达式。
自 |
1.4.0 |
---|
类型
字符串
regexVowel
匹配元音的正则表达式
自 |
1.4.0 |
---|
类型
字符串