课程讲解 如何使用SQL Server校勘功能
来源:builder.com 发布时间:2009-01-13 13:27:00
校勘(collation)是指对代码页、字母大小写、音调、语言和字母表的整理,很多校勘都是在数据进入数据库之前进行的,根据我的经验,北美的大部分数据库管理员都在使用默认的大小写敏感的校勘设定,这对于数据本身没有影响,但是对于数据的比较和索引会造成影响。
这篇文章将向您介绍一些相关的校勘方法,以及数据库对多种字符集的处理方法。
为了说明校勘的使用,我们首先来创建一个数据库,列表A给出了创建数据库的代码。
CREATE SCHEMA CaseCheck
GO
CREATE TABLE CaseCheck.Names
(
NamePK Int Identity(1,1) PRIMARY KEY,
Name Varchar(50) NOT NULL
)
GO
INSERT INTO CaseCheck.Names VALUES ('Fuller')
INSERT INTO CaseCheck.Names VALUES ('FuLLer')
INSERT INTO CaseCheck.Names VALUES ('FULLER')
INSERT INTO CaseCheck.Names VALUES ('fuller')
GO
列表A
列表B是一些查询,对于大小写不敏感的情况,这几个查询将返回相同的四个数据行,但是如果我们的任务是从数据行中选取大小写完全匹配的记录呢?
SELECT * FROM CaseCheck.Names
SELECT * FROM CaseCheck.Names WHERE Name = 'fuller'
SELECT * FROM CaseCheck.Names WHERE Name = 'FULLER'
SELECT * FROM CaseCheck.Names WHERE Name = 'fuller'
GO
列表 B
现在我们就要使用校勘的功能了,尽管在数据库创建的时候,数据库管理员已经指定了校勘的选项,但是您可以通过WHERE语句中的COLLATE选项来使用不同的校勘设定,在列表C的查询中,前三个都返回了一条记录,而最后一个查询的返回结果为空。
SELECT * FROM CaseCheck.Names WHERE Name = 'fuller'
COLLATE Latin1_General_CS_AS
SELECT * FROM CaseCheck.Names WHERE Name = 'FULLER'
COLLATE Latin1_General_CS_AS
SELECT * FROM CaseCheck.Names WHERE Name = 'fuller'
COLLATE Latin1_General_CS_AS
SELECT * FROM CaseCheck.Names WHERE Name = 'FUllER'
COLLATE Latin1_General_CS_AS
GO
列表 C
假设您现在想把所有'fuller'形式的拼写改为'Fuller'(包括像'fUlLEr'这种毫无意义的拼写组合),通过列表D中的代码,您可以非常轻松地实现这一功能。
UPDATE CaseCheck.NamesSET Name = UPPER(LEFT(Name,1))
+ LOWER(SUBSTRING(Name,2,LEN(Name)-1))
列表D
从大型主机上导入数据的时候,我都会首先运行以上的代码,这样就不必再担心单词大小写的问题了。
如果您想查看所有的校勘选项及其简要说明,可以运行以下的SQL代码:SELECT * FROM ::fn_helpcollations()。
想要查看数据库当前的校勘设定,可以使用以下代码:
SELECT collation_name
FROM master.sys.databases
WHERE Name='SQLTips'
在列表E中,我添加了一些带有特殊字符的数据行,我使用了我的好朋友DejanSunderic的名字,他的名字应该拼写为Šunderic'(字母c实际上应该有重音符号的,由于使用的字体,所以显示成了现在的效果)。
INSERT INTO CaseCheck.Names VALUES
(NChar(352)+ 'underi' + NChar(263))
INSERT INTO CaseCheck.Names VALUES
('SUNDERIC')
INSERT INTO CaseCheck.Names VALUES
('sUnDeRI' + Nchar(263))
INSERT INTO CaseCheck.Names VALUES
('Sunderi' + Nchar(263))
GO
列表 E
如果不使用COLLATE,那么会发生非常有意思的事情,运行一下的查询语句:
SELECT *
FROM CaseCheck.Names
WHERE Name LIKE N'S%'
您得到的结果是:
NamePK Name
6 SUNDERIC
7 sUnDeRIc
8 Sunderic
注意,带有特殊字符的'Šunderic'并没有被包含在内,
让我们再来看看另外一个实验:
SELECT * FROM CaseCheck.Names
ORDER BY Name
运行此查询的结果如下:
NamePK Name
5 Šunderic
1 Fuller
2 FuLLer
3 FULLER
4 fuller
6 SUNDERIC
7 sUnDeRIc
这里有很明显的错误,PK5应当位于'Fuller'之后,我不是语言专家,因此不知道它应该位于Ss的什么位置,但是我觉得这是本地规则造成的结果,很明显,'Šunderic'应该出现在所有的'Fuller'之后,而不是在'Fuller'前面。
我还进行了另外一项实验,使用西里尔字母来拼写我的好朋友Alexander Karmanov的名字,在图片A中您可以看到西里尔字母的拼写,我运行了图片B所示的语句来添加这条记录。
图片A
图片B
图片C
使用默认的字符集,此查询将会返回一系列问号,如果您想得到正确的结果,那么必须需要使用数据库可以接受的Unicode字符集,参见图片C。
如果您想确认一个给定数据库中使用的初始校勘,可以使以下的代码:
SELECT collation_name
FROM master.sys.databases
WHERE Name = 'SQLTips'
猜你喜欢
- 在一次ASP程序中不能正常连接MSSQL出现出错信息如下:以下为引用的内容:HTTP/1.1 200 OK S
- 如何选择速度最快的站点? <html><head><meta http-equiv=&qu
- 从人类认知的角度的看,人类擅长识别并不擅长于记忆,当一个用户面对浩瀚的信息海洋,通常会产生畏惧感,会本能的对这些信息片段进行加工找出其内在的
- 最近写一个小小的留言本;算是对AJAX的综合应用迈出了一小步在制作过程中有很多兴奋的体验 虽然和以前的制作方法比起来繁杂了一些但是整个页面的
- 代码'########### '检测远程文件是否存在 '########### function CheckURL(
- 一、DAFONT 英文字体很多,分类很详细,字体多数都是免费,唯一的缺点中文字体少了些.http://www.dafont.co
- 1.delete不能使自动编号返回为起始值。但是truncate能使自动增长的列的值返回为默认的种子 2.truncate只能一次清空,不能
- HTML5,被传为Flash 的杀手,是一种用于web 应用程序开发、具有变革意义的网络技术。HTML 5提供了一些新的元素和属性,其中有些
- 今天好不容易闲下来半天,所以和大家分享一下我之前总结的一套Web UI 设计命名规范,也就是网站用户界面设计(俗称网页设计)命名规范。这套规
- 现状≠将来?程序员做设计本身就很悲哀,纠结于客户与坚持之间就更是如此。无论我今后的路会怎么走,我想始终不变的事情就是与客户博弈了。无论是放弃
- XML有很多相关的技术,将这些技术结合起来,才能充分发挥XML的强大功能。这些技术包括:Xlink与Xpointer(设置XML的超链接)、
- 一个网站空间,但是却可以实现多个域名的访问的一段ASP代码:<%if Request.ServerVariables("SE
- 阅读上一篇:你是真正的用户体验设计者吗? Ⅱ系统和用户环境设计苹果系统成功在于系统架构。简化系统本身,设备只能变得更好、更小、性能更强大。在
- 出自: 编程中国 http://www.bc-cn.net作者: 天涯听雨 &nbs
- 参数Parameters解析响应时间resolveTimeout 数据类型:长整型。简单地说就是程序对目标主机的名字解析解析的一个过程时间。
- javascript代码编写在页面中实现页内搜索功能,类似Word等文本编辑软件里的搜索功能,只要是页面中的字符(别管是显在的还是隐蔽在文本
- Jon Wiley, User Experience Designer for Google Apps, outlined some of
- 数据的安全性策略: 数据的生考虑应基于数据的重要性。如果数据不是很重要,那么数据的安全性策略可以稍稍放松一些。然而,如果数据很重要,那么应该
- 下面的各种屏蔽网页鼠标或键盘的代码都是我以前收集的,挺实用的,防一般的访客还是很有用的。1.禁止鼠标选中捕捉网页文字图片等元素在<bo
- 写了个简洁的隔行变色代码,支持三种动作变化颜色<!DOCTYPE html PUBLIC "-//W3C//DTD XHTM