16 ответов:
вот UDF, который будет делать трюк...
create function ProperCase(@Text as varchar(8000)) returns varchar(8000) as begin declare @Reset bit; declare @Ret varchar(8000); declare @i int; declare @c char(1); if @Text is null return null; select @Reset = 1, @i = 1, @Ret = ''; while (@i <= len(@Text)) select @c = substring(@Text, @i, 1), @Ret = @Ret + case when @Reset = 1 then UPPER(@c) else LOWER(@c) end, @Reset = case when @c like '[a-zA-Z]' then 0 else 1 end, @i = @i + 1 return @Ret endвам все равно придется использовать его для обновления ваших данных.
функции:
- "правильные регистры" все "прописные" слова, которые разделены пробелом
- оставляет "строчные слова" в покое
- работает правильно, даже для не-английских алфавитов
- является портативным в том, что он не использует причудливые функции последних версий SQL server
- можно легко изменить, чтобы использовать NCHAR и NVARCHAR для поддержки unicode,а также любую длину параметра, которую вы считаете подходящей
- определение пробела можно настроить
CREATE FUNCTION ToProperCase(@string VARCHAR(255)) RETURNS VARCHAR(255) AS BEGIN DECLARE @i INT -- index DECLARE @l INT -- input length DECLARE @c NCHAR(1) -- current char DECLARE @f INT -- first letter flag (1/0) DECLARE @o VARCHAR(255) -- output string DECLARE @w VARCHAR(10) -- characters considered as white space SET @w = '[' + CHAR(13) + CHAR(10) + CHAR(9) + CHAR(160) + ' ' + ']' SET @i = 1 SET @l = LEN(@string) SET @f = 1 SET @o = '' WHILE @i <= @l BEGIN SET @c = SUBSTRING(@string, @i, 1) IF @f = 1 BEGIN SET @o = @o + @c SET @f = 0 END ELSE BEGIN SET @o = @o + LOWER(@c) END IF @c LIKE @w SET @f = 1 SET @i = @i + 1 END RETURN @o ENDрезультат:
dbo.ToProperCase('ALL UPPER CASE and SOME lower ÄÄ ÖÖ ÜÜ ÉÉ ØØ ĈĈ ÆÆ') ----------------------------------------------------------------- All Upper Case and Some lower Ää Öö Üü Éé Øø Cc Ææ
Если вы можете включить среду CLR в SQL Server (требуется 2005 или более поздней версии), то вы могли бы создать функцию CLR использует TextInfo.ToTitleCase встроенная функция что позволит вам создать культурный способ сделать это всего в нескольких строках кода.
Я немного поздно в игре, но я считаю, что это более функционально и он работает с любым языком, включая русский, немецкий, тайский, вьетнамский и т. д. Он будет делать заглавные буквы после ' или-или . или (или ) или пространство (очевидно :).
CREATE FUNCTION [dbo].[fnToProperCase]( @name nvarchar(500) ) RETURNS nvarchar(500) AS BEGIN declare @pos int = 1 , @pos2 int if (@name <> '')--or @name = lower(@name) collate SQL_Latin1_General_CP1_CS_AS or @name = upper(@name) collate SQL_Latin1_General_CP1_CS_AS) begin set @name = lower(rtrim(@name)) while (1 = 1) begin set @name = stuff(@name, @pos, 1, upper(substring(@name, @pos, 1))) set @pos2 = patindex('%[- ''.)(]%', substring(@name, @pos, 500)) set @pos += @pos2 if (isnull(@pos2, 0) = 0 or @pos > len(@name)) break end end return @name END GO
Я знаю, что это поздно пост в этой теме, но, стоит посмотреть. Эта функция работает для меня все время. Так что подумайте о том, чтобы поделиться им.
CREATE FUNCTION [dbo].[fnConvert_TitleCase] (@InputString VARCHAR(4000) ) RETURNS VARCHAR(4000) AS BEGIN DECLARE @Index INT DECLARE @Char CHAR(1) DECLARE @OutputString VARCHAR(255) SET @OutputString = LOWER(@InputString) SET @Index = 2 SET @OutputString = STUFF(@OutputString, 1, 1,UPPER(SUBSTRING(@InputString,1,1))) WHILE @Index <= LEN(@InputString) BEGIN SET @Char = SUBSTRING(@InputString, @Index, 1) IF @Char IN (' ', ';', ':', '!', '?', ',', '.', '_', '-', '/', '&','''','(') IF @Index + 1 <= LEN(@InputString) BEGIN IF @Char != '''' OR UPPER(SUBSTRING(@InputString, @Index + 1, 1)) != 'S' SET @OutputString = STUFF(@OutputString, @Index + 1, 1,UPPER(SUBSTRING(@InputString, @Index + 1, 1))) END SET @Index = @Index + 1 END RETURN ISNULL(@OutputString,'') END
Если вы находитесь в службах SSIS, импортирующих данные со смешанным регистром, и вам нужно выполнить поиск по столбцу с правильным регистром, вы заметите, что поиск не выполняется там, где источник смешан, и источник поиска является правильным. Вы также заметите, что вы не можете использовать функции right и left is SSIS для SQL Server 2008r2 для производных столбцов. Вот решение, которое работает для меня:
UPPER(substring(input_column_name,1,1)) + LOWER(substring(input_column_name, 2, len(input_column_name)-1))
ссылка, которую я опубликовал выше, является отличным вариантом, который решает главную проблему: мы никогда не можем программно учитывать все случаи (Смит-Джонс, фон Хауссен, Джон Смит М. Д.), По крайней мере, не в элегантной манере. Тони вводит понятие символа исключения / разрыва, чтобы иметь дело с этими случаями. В любом случае, основываясь на идее Cervo (верхние все нижние символы предшествуют пробелу), операторы replace могут быть завернуты в одну таблицу на основе replace. Действительно, любой низкий / вверх характер комбинация может быть вставлена в @alpha и оператор не изменится:
declare @str nvarchar(8000) declare @alpha table (low nchar(1), up nchar(1)) set @str = 'ALL UPPER CASE and SOME lower ÄÄ ÖÖ ÜÜ ÉÉ ØØ ĈĈ ÆÆ' -- stage the alpha (needs number table) insert into @alpha -- A-Z / a-z select nchar(n+32), nchar(n) from dbo.Number where n between 65 and 90 or n between 192 and 223 -- append space at start of str set @str = lower(' ' + @str) -- upper all lower case chars preceded by space select @str = replace(@str, ' ' + low, ' ' + up) from @Alpha select @str
вот версия, которая использует таблицу последовательности или чисел, а не цикл. Вы можете изменить предложение WHERE, чтобы добавить свои личные правила для того, когда конвертировать символ в верхний регистр. Я только что включил простой набор, который будет в верхнем регистре любую букву, которая продолжается не буквой, за исключением Апостроф. Это означает, что 123apple будет иметь совпадение на "а", потому что" 3 " не является буквой. Если вы хотите просто пробелы (пробел, табуляция, возврат каретки, line-feed), вы можете заменить шаблон
'[^a-z]'С'[' + Char(32) + Char(9) + Char(13) + Char(10) + ']'.
CREATE FUNCTION String.InitCap( @string nvarchar(4000) ) RETURNS nvarchar(4000) AS BEGIN -- 1. Convert all letters to lower case DECLARE @InitCap nvarchar(4000); SET @InitCap = Lower(@string); -- 2. Using a Sequence, replace the letters that should be upper case with their upper case version SELECT @InitCap = Stuff( @InitCap, n, 1, Upper( SubString( @InitCap, n, 1 ) ) ) FROM ( SELECT (1 + n1.n + n10.n + n100.n + n1000.n) AS n FROM (SELECT 0 AS n UNION SELECT 1 UNION SELECT 2 UNION SELECT 3 UNION SELECT 4 UNION SELECT 5 UNION SELECT 6 UNION SELECT 7 UNION SELECT 8 UNION SELECT 9) AS n1 CROSS JOIN (SELECT 0 AS n UNION SELECT 10 UNION SELECT 20 UNION SELECT 30 UNION SELECT 40 UNION SELECT 50 UNION SELECT 60 UNION SELECT 70 UNION SELECT 80 UNION SELECT 90) AS n10 CROSS JOIN (SELECT 0 AS n UNION SELECT 100 UNION SELECT 200 UNION SELECT 300 UNION SELECT 400 UNION SELECT 500 UNION SELECT 600 UNION SELECT 700 UNION SELECT 800 UNION SELECT 900) AS n100 CROSS JOIN (SELECT 0 AS n UNION SELECT 1000 UNION SELECT 2000 UNION SELECT 3000) AS n1000 ) AS Sequence WHERE n BETWEEN 1 AND Len( @InitCap ) AND SubString( @InitCap, n, 1 ) LIKE '[a-z]' /* this character is a letter */ AND ( n = 1 /* this character is the first `character` */ OR SubString( @InitCap, n-1, 1 ) LIKE '[^a-z]' /* the previous character is NOT a letter */ ) AND ( n < 3 /* only test the 3rd or greater characters for this exception */ OR SubString( @InitCap, n-2, 3 ) NOT LIKE '[a-z]''[a-z]' /* exception: The pattern <letter>'<letter> should not capatolize the letter following the apostrophy */ ) -- 3. Return the modified version of the input RETURN @InitCap END
имело бы смысл вести поиск исключений, чтобы заботиться о фон Неймана, Маккейна, DeGuzman, и Джонсона-Смита.
Я знаю, что дьявол находится в деталях (особенно там, где речь идет о личных данных людей), и что было бы очень приятно иметь правильно заглавные имена, но вышеупомянутые хлопоты-это то, почему прагматичные, сознательные во времени среди нас используют следующее:
SELECT UPPER('Put YoUR O'So oddLy casED McWeird-nAme von rightHERE here')по моему опыту, люди прекрасно видят свое имя ... даже если это половина предложения.
см.: русские использовали карандаш!
Я думаю, вы обнаружите, что следующее более эффективно:
IF OBJECT_ID('dbo.ProperCase') IS NOT NULL DROP FUNCTION dbo.ProperCase GO CREATE FUNCTION dbo.PROPERCASE ( @str VARCHAR(8000)) RETURNS VARCHAR(8000) AS BEGIN SET @str = ' ' + @str SET @str = REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE( @str, ' a', ' A'), ' b', ' B'), ' c', ' C'), ' d', ' D'), ' e', ' E'), ' f', ' F'), ' g', ' G'), ' h', ' H'), ' i', ' I'), ' j', ' J'), ' k', ' K'), ' l', ' L'), ' m', ' M'), ' n', ' N'), ' o', ' O'), ' p', ' P'), ' q', ' Q'), ' r', ' R'), ' s', ' S'), ' t', ' T'), ' u', ' U'), ' v', ' V'), ' w', ' W'), ' x', ' X'), ' y', ' Y'), ' z', ' Z') RETURN RIGHT(@str, LEN(@str) - 1) END GOоператор replace может быть вырезан и вставлен непосредственно в SQL-запрос. Это ультра уродливо, однако, заменив @str на столбец, который вас интересует, вы не будете платить цену за неявный курсор, как вы будете с udfs, опубликованными таким образом. Я считаю, что даже с помощью моего UDF это гораздо более эффективно.
Oh и вместо того, чтобы генерировать оператор replace вручную использовать это:
-- Code Generator for expression DECLARE @x INT, @c CHAR(1), @sql VARCHAR(8000) SET @x = 0 SET @sql = '@str' -- actual variable/column you want to replace WHILE @x < 26 BEGIN SET @c = CHAR(ASCII('a') + @x) SET @sql = 'REPLACE(' + @sql + ', '' ' + @c+ ''', '' ' + UPPER(@c) + ''')' SET @x = @x + 1 END PRINT @sqlв любом случае это зависит от количества строк. Я хотел бы, чтобы вы могли просто сделать s/\b([a-z])/uc $1/, но мы хорошо работаем с инструментами, которые у нас есть.
Примечание Вы должны были бы использовать это, как вы должны были бы использовать его как....Выберите dbo.ProperCase (Нижний (столбец)), так как столбец находится в верхнем регистре. Это на самом деле работает довольно быстро на моей таблице из 5000 записей (даже не одна секунда) даже с более низким.
в ответ на шквал комментариев по поводу интернационализация я представляю следующую реализацию, которая обрабатывает каждый символ ascii, полагаясь только на реализацию SQL Server верхнего и нижнего. Помните, что переменные, которые мы используем здесь, являются VARCHAR, что означает, что они могут содержать только значения ASCII. Для того, чтобы использовать другие международные алфавиты, вы должны использовать NVARCHAR. Логика будет аналогичной, но вам нужно будет использовать UNICODE и NCHAR вместо ASCII и CHAR, а оператор replace будет намного больше огромный....
-- Code Generator for expression DECLARE @x INT, @c CHAR(1), @sql VARCHAR(8000), @count INT SEt @x = 0 SET @count = 0 SET @sql = '@str' -- actual variable you want to replace WHILE @x < 256 BEGIN SET @c = CHAR(@x) -- Only generate replacement expression for characters where upper and lowercase differ IF @x = ASCII(LOWER(@c)) AND @x != ASCII(UPPER(@c)) BEGIN SET @sql = 'REPLACE(' + @sql + ', '' ' + @c+ ''', '' ' + UPPER(@c) + ''')' SET @count = @count + 1 END SET @x = @x + 1 END PRINT @sql PRINT 'Total characters substituted: ' + CONVERT(VARCHAR(255), @count)в основном предпосылкой моего метода является торговля предварительными вычислениями для эффективности. Полная реализация ASCII выглядит следующим образом:
IF OBJECT_ID('dbo.ProperCase') IS NOT NULL DROP FUNCTION dbo.ProperCase GO CREATE FUNCTION dbo.PROPERCASE ( @str VARCHAR(8000)) RETURNS VARCHAR(8000) AS BEGIN SET @str = ' ' + @str SET @str = REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(@str, ' a', ' A'), ' b', ' B'), ' c', ' C'), ' d', ' D'), ' e', ' E'), ' f', ' F'), ' g', ' G'), ' h', ' H'), ' i', ' I'), ' j', ' J'), ' k', ' K'), ' l', ' L'), ' m', ' M'), ' n', ' N'), ' o', ' O'), ' p', ' P'), ' q', ' Q'), ' r', ' R'), ' s', ' S'), ' t', ' T'), ' u', ' U'), ' v', ' V'), ' w', ' W'), ' x', ' X'), ' y', ' Y'), ' z', ' Z'), ' š', ' Š'), ' œ', ' Œ'), ' ž', ' Ž'), ' à', ' À'), ' á', ' Á'), ' â', ' Â'), ' ã', ' Ã'), ' ä', ' Ä'), ' å', ' Å'), ' æ', ' Æ'), ' ç', ' Ç'), ' è', ' È'), ' é', ' É'), ' ê', ' Ê'), ' ë', ' Ë'), ' ì', ' Ì'), ' í', ' Í'), ' î', ' Î'), ' ï', ' Ï'), ' ð', ' Ð'), ' ñ', ' Ñ'), ' ò', ' Ò'), ' ó', ' Ó'), ' ô', ' Ô'), ' õ', ' Õ'), ' ö', ' Ö'), ' ø', ' Ø'), ' ù', ' Ù'), ' ú', ' Ú'), ' û', ' Û'), ' ü', ' Ü'), ' ý', ' Ý'), ' þ', ' Þ'), ' ÿ', ' Ÿ') RETURN RIGHT(@str, LEN(@str) - 1) END GO
Не слишком ли поздно вернуться и получить данные без верхнего регистра?
фон Неймана, Маккейна, DeGuzman, и Джонсона-Смита вашей клиентской базы может не понравиться результат вашей обработки...
кроме того, я предполагаю, что это предназначено для одноразового обновления данных? Возможно, будет проще экспортировать, фильтровать / изменять и повторно импортировать исправленные имена в БД, а затем вы можете использовать подходы, отличные от SQL, для исправления имен...
вот еще один вариант, который я нашел на SQLTeam.com форумы @ http://www.sqlteam.com/forums/topic.asp?TOPIC_ID=47718
create FUNCTION PROPERCASE ( --The string to be converted to proper case @input varchar(8000) ) --This function returns the proper case string of varchar type RETURNS varchar(8000) AS BEGIN IF @input IS NULL BEGIN --Just return NULL if input string is NULL RETURN NULL END --Character variable declarations DECLARE @output varchar(8000) --Integer variable declarations DECLARE @ctr int, @len int, @found_at int --Constant declarations DECLARE @LOWER_CASE_a int, @LOWER_CASE_z int, @Delimiter char(3), @UPPER_CASE_A int, @UPPER_CASE_Z int --Variable/Constant initializations SET @ctr = 1 SET @len = LEN(@input) SET @output = '' SET @LOWER_CASE_a = 97 SET @LOWER_CASE_z = 122 SET @Delimiter = ' ,-' SET @UPPER_CASE_A = 65 SET @UPPER_CASE_Z = 90 WHILE @ctr <= @len BEGIN --This loop will take care of reccuring white spaces WHILE CHARINDEX(SUBSTRING(@input,@ctr,1), @Delimiter) > 0 BEGIN SET @output = @output + SUBSTRING(@input,@ctr,1) SET @ctr = @ctr + 1 END IF ASCII(SUBSTRING(@input,@ctr,1)) BETWEEN @LOWER_CASE_a AND @LOWER_CASE_z BEGIN --Converting the first character to upper case SET @output = @output + UPPER(SUBSTRING(@input,@ctr,1)) END ELSE BEGIN SET @output = @output + SUBSTRING(@input,@ctr,1) END SET @ctr = @ctr + 1 WHILE CHARINDEX(SUBSTRING(@input,@ctr,1), @Delimiter) = 0 AND (@ctr <= @len) BEGIN IF ASCII(SUBSTRING(@input,@ctr,1)) BETWEEN @UPPER_CASE_A AND @UPPER_CASE_Z BEGIN SET @output = @output + LOWER(SUBSTRING(@input,@ctr,1)) END ELSE BEGIN SET @output = @output + SUBSTRING(@input,@ctr,1) END SET @ctr = @ctr + 1 END END RETURN @output END GO SET QUOTED_IDENTIFIER OFF GO SET ANSI_NULLS ON GO
только что узнал о
InitCap().вот пример кода:
SELECT ID ,InitCap(LastName ||', '|| FirstName ||' '|| Nvl(MiddleName,'')) AS RecipientName FROM SomeTable
это работало в SSMS:
Select Jobtitle, concat(Upper(LEFT(jobtitle,1)), SUBSTRING(jobtitle,2,LEN(jobtitle))) as Propercase From [HumanResources].[Employee]
Comments