SQL Server (bất kỳ phiên bản nào) coi bất kỳ ký tự không chữ và số nào là một công cụ ngắt từ tiềm năng. Hơn có nghĩa là có những tình huống mà các ký tự dự kiến phá vỡ các từ được xử lý theo một cách khác (trực tiếp hoặc mở rộng) bởi máy chủ.
Một công cụ ngắt từ điển hình là dấu chấm ('.')
Đây là một số biến thể của xử lý dấu chấm (AICI).
select display_term from sys.dm_fts_parser('"The great .NET."', 1033, 0, 0);
trả về "the", "great" và ".net"
select display_term from sys.dm_fts_parser('"The great ASP.NET."', 1033, 0, 0);
trả về "the", "great", "asp.net", "asp" và "net"
select display_term from sys.dm_fts_parser('"G.I.S."', 1033, 0, 0);
trả về "gis" và "gis"
select display_term from sys.dm_fts_parser('"3.14"', 1033, 0, 0);
trả về "3.14" và "nn3d14"
Và nó không chỉ là dấu chấm.
chọn display_term từ sys.dm_raft_parser ('"ứng dụng điều khiển dữ liệu"', 1033, 0, 0);
trả về "hướng dữ liệu", "dữ liệu", "điều khiển" và "ứng dụng"
select display_term from sys.dm_fts_parser('"1-0"', 1033, 0, 0);
trả về "1-0", "1", "nn1", "0" và "nn0"
select display_term from sys.dm_fts_parser('"c# j# f# a#"', 1033, 0, 0);
trả về "c #", "j #", "f" và "a" (f # bị thiếu như một quy tắc)
select display_term, * from sys.dm_fts_parser('"c c+ c++"', 1033, 0, 0);
trả về "c", "c" và "c ++"
Danh sách các công cụ ngắt từ (tiềm năng) (Stuart chỉ ra cách để có được nó trong câu trả lời của ông) là phần dễ dàng. Phần khó là để có được danh sách các quy tắc nội bộ đang sử dụng; chúng được xử lý / bao gồm trong MSWB7 *.