Câu trả lời của Dave Bish là tốt và hoạt động đúng.
Điều đáng chú ý là mặc dù thay thế Cast<Match>()
bằng OfType<Match>()
sẽ đẩy nhanh tốc độ.
Code wold trở thành:
var arr = Regex.Matches(strText, @"\b[A-Za-z-']+\b")
.OfType<Match>()
.Select(m => m.Groups[0].Value)
.ToArray();
Kết quả hoàn toàn giống nhau (và giải quyết vấn đề của OP theo cùng một cách) nhưng đối với các chuỗi lớn thì nhanh hơn.
Mã kiểm tra:
static void Test()
{
Stopwatch sw = new Stopwatch();
StringBuilder sb = new StringBuilder();
string strText = "this will become a very long string after my code has done appending it to the stringbuilder ";
Enumerable.Range(1, 100000).ToList().ForEach(i => sb.Append(strText));
strText = sb.ToString();
sw.Start();
var arr = Regex.Matches(strText, @"\b[A-Za-z-']+\b")
.OfType<Match>()
.Select(m => m.Groups[0].Value)
.ToArray();
sw.Stop();
Console.WriteLine("OfType: " + sw.ElapsedMilliseconds.ToString());
sw.Reset();
sw.Start();
var arr2 = Regex.Matches(strText, @"\b[A-Za-z-']+\b")
.Cast<Match>()
.Select(m => m.Groups[0].Value)
.ToArray();
sw.Stop();
Console.WriteLine("Cast: " + sw.ElapsedMilliseconds.ToString());
}
Đầu ra như sau:
OfType: 6540
Cast: 8743
Đối với các chuỗi rất dài Cast () do đó sẽ chậm hơn.
OfType<Match>()
cho điều này thay vìCast<Match>()
... Sau đó, một lần nữa, kết quả sẽ giống nhau.