Porteren

实现 StemmerInterface

Porter 英语词干提取类。

此类改编自 Richard Heyes 编写的类。请参阅上面的版权和链接信息。

1.0

Joomla 框架

方法

cvc

检查结尾的 CVC 序列,其中第二个 C 不是 W、X 或 Y

cvc( str) : 

1.0

参数

str

string要检查的字符串

响应

bool结果

doubleConsonant

如果给定字符串在字符串结尾处包含两个相同的辅音字母,则返回 true/false。

doubleConsonant( str) : 

1.0

参数

str

string要检查的字符串

响应

bool结果

m

m() 测量 $str 中辅音序列的数量。如果 c 是辅音序列,v 是元音序列,而 <..> 表示任意存在,

m( str) : 

给出 0vc给出 1vcvc给出 2vcvcvc给出 3

1.0

参数

str

string要返回 m 计数的字符串

响应

intm 计数

replace

用第二个字符串替换第一个字符串,位于字符串结尾处。如果给出第三个参数,则前面的字符串必须至少匹配该 m 计数。

replace( &str,  check,  repl,  m = null) : 

1.0

参数

str

string要检查的字符串

check

string要检查的结尾

repl

string替换字符串

m

int可选的最小 m() 数量

响应

bool$check 字符串是否位于 $str 字符串的结尾处。True 不一定意味着它被替换了。

stem

用于对词元进行词干提取并返回词根的方法。

stem( token,  lang) : 

1.0

参数

token

string要进行词干提取的词元。

lang

string词元的语言。

响应

string词根词元。

step1ab

步骤 1

step1ab( word) : 

1.0

参数

word

string要进行词干提取的词元。

响应

字符串

step1c

步骤 1c

step1c( word) : 

1.0

参数

word

string要进行词干提取的词元。

响应

字符串

step2

步骤 2

step2( word) : 

1.0

参数

word

string要进行词干提取的词元。

响应

字符串

step3

步骤 3

step3( word) : 

1.0

参数

word

string要进行词干提取的词元。

响应

字符串

step4

步骤 4

step4( word) : 

1.0

参数

word

string要进行词干提取的词元。

响应

字符串

step5

步骤 5

step5( word) : 

1.0

参数

word

string要进行词干提取的词元。

响应

字符串

属性

cache

已进行词干提取的词元的内部缓存。

1.0

类型

array<string|int, mixed>

regexConsonant

匹配辅音的正则表达式。

1.4.0

类型

字符串

regexVowel

匹配元音的正则表达式

1.4.0

类型

字符串