取下标
String
String 用 String.Index 取下标(subscript)得到 Character,String.Index 要从 String 中获取
let greeting = "Guten Tag!"greeting[greeting.startIndex] // Character "G"greeting[greeting.index(before: greeting.endIndex)] // Character "!"greeting[greeting.index(after: greeting.startIndex)] // Character "u"let index = greeting.index(greeting.startIndex, offsetBy: 7) greeting[index] // Character "a"
String 用 Range
let str = "abc"str[str.startIndex..Character
String 通过 characters 属性获得 String.CharacterView,表示屏幕上显示的内容。String.CharacterView 通过 String.CharacterView.Index 取下标得到 Character,String.CharacterView.Index 要从 String.CharacterView 中获取
let str = "abc"let characters = str.characters // String.CharacterViewcharacters[characters.startIndex] // Character "a"注意,String.CharacterView 不遵循 RandomAccessCollection 协议,用 String.CharacterView.Index 取下标不可以随机访问。另外,String.CharacterView.Index 与 String.Index 是相同的类型,属于 Struct。String.Index 的文档在 String 文档下
typealias Index = String.CharacterView.IndexString.CharacterView 通过 Range
得到 String.CharacterView。用 Character 和 String.CharacterView 都可以生成 String let str = "abc"let characters = str.characters // String.CharacterViewlet characters2 = characters[characters.startIndex..用 String.CharacterView 生成 Array
,可以用 Int、Range 取下标。用 Array 也可以生成 String let str = "abc"let arr = Array(str.characters) // Array["a", "b", "c"]arr[1] // Character "b"arr[1...2] // ArraySlice ["b", "c"]String(arr) // String "abc" Character 可以直接与 "a" 比较
let str = "abc"let a = str[str.startIndex] // Character "a"let b = str[str.index(str.startIndex, offsetBy: 1)] // Character "b"a == "a" // trueb > "a" // trueUTF-8
String 通过 utf8 属性获得 String.UTF8View,表示 UTF-8 编码的内容。String.UTF8View 通过 String.UTF8View.Index 取下标得到 UTF8.CodeUnit,实际上是 UInt8;通过 Range
取下标得到 String.UTF8View。String.UTF8View.Index 要从 String.UTF8View 中获取。String.UTF8View 不遵循 RandomAccessCollection 协议,用 String.UTF8View.Index 取下标不可以随机访问。用 String.UTF8View 生成 Array ,可以用 Int、Range 取下标。用 String.UTF8View 可以生成 String。用 UInt8 或 Array 也可以生成 String,但内容表示数字或数字数组,不是数字的 UTF-8 编码内容。 let str = "abc"let utf8 = str.utf8 // String.UTF8Viewlet n = utf8[utf8.startIndex] // UInt8 97let a = utf8[utf8.startIndex..[97, 98, 99]let n2 = arr[0] // UInt8 97let arr2 = arr[0...1] // // ArraySlice [97, 98] String 通过 utf8CString 属性获得 ContiguousArray
,实际上是 ContiguousArray ,表示 UTF-8 编码的内容并且末尾增加一个 0,所以长度比 utf8 属性的长度大 1。ContiguousArray 可以用 Int、Range 取下标,分别得到 Int8 和 ArraySlice 。ContiguousArray 遵循 RandomAccessCollection 协议,用 Int 取下标可以随机访问。 let str = "abc"let utf8 = str.utf8CString // ContiguousArray[97, 98, 99, 0]let a = utf8[0] // Int8 97let ab = utf8[0...1] // ArraySlice [97, 98] UTF-16
String 通过 utf16 属性获得 String.UTF16View,表示 UTF-16 编码的内容。String.UTF16View 通过 String.UTF16View.Index 取下标得到 UTF16.CodeUnit,实际上是 UInt16;通过 Range
取下标得到 String.UTF16View。String.UTF16View.Index 要从 String.UTF16View 中获取。String.UTF16View 遵循 RandomAccessCollection 协议,用 String.UTF16View.Index 取下标可以随机访问。用 String.UTF16View 生成 Array ,可以用 Int、Range 取下标。用 String.UTF16View 可以生成 String。用 UInt16 或 Array 也可以生成 String,但内容表示数字或数字数组,不是数字的 UTF-16 编码内容。 let str = "abc"let utf16 = str.utf16 // String.UTF16Viewlet n = utf16[utf16.startIndex] // UInt16 97let a = utf16[utf16.startIndex..[97, 98, 99]let n2 = arr[0] // UInt16 97let arr2 = arr[0...1] // // ArraySlice [97, 98] 性能对比
对 String、String.CharacterView、Array
、String.UTF8View、Array 、ContiguousArray 、String.UTF16View、Array 进行判空(isEmpty)、获取长度(count)、一个位置的取下标([index])、一段距离的取下标([range])测试,统计执行时间。 定义测试类型、打印和更新时间的方法、要测试的 String
import Foundationenum TestType { case isEmpty case count case index case range }func printAndUpdateTime(_ date: inout Date) { let now = Date() print(now.timeIntervalSince(date)) date = now }let s = "aasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafcpiluioufnlkqjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjliopjktyuljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasderwytwghfsdfsdfgfdsg vrutj7edbj7 fdgotuyoergcwhmkl5lknjklqawkyrcqjljkljqjlqjhbrlqwfcbhafci luioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcvcnvbwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjkn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg iopiouvrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkfghngdljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmbkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqasdfsdwkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljdqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasddfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbsdfdsrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfsadfsdgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqsdfasjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdafgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlkasdfsdfsdfgfdsg vrutj7edbj7 ergcwhmkl5lknjklqawkrcqjljkljqjlqjhbrlqwfcbhafciluioufnlkjvjakjn fnvjalgkhlkdkjlk"测试代码
let loopCount = 10000let index = s.characters.count / 2let testType: TestType = .rangeprint(testType)var date = Date() forLoop: for _ in 0..测试结果
判空
获取长度
一个位置的取下标
一段距离的取下标
以上比较中,判断 String 是否为空,访问 String 的 isEmpty 速度最快。对于其他操作,遵循 RandomAccessCollection 协议(ContiguousArray
、String.UTF16View 以及其他 Array)的类型效率较高。 进一步比较判空操作
let loopCount = 10000var date = Date()for _ in 0..与访问 String 的 isEmpty 相比,判断 String 是否等于空 String 速度更快!
注意到文档中,对 String.UTF8View 和 String.UTF16View 的 Range 取下标方法的说明
subscript(bounds: Range) -> String.UTF8View { get }subscript(bounds: Range ) -> String.UTF16View { get } Complexity: O(n) if the underlying string is bridged from Objective-C, where n is the length of the string; otherwise, O(1).如果 String 是从 Objective-C 的 NSString 桥接来的,时间复杂度为 O(n),否则为 O(1)。这句话怎么理解呢?前面说了,String.UTF8View 不遵循 RandomAccessCollection 协议,而 String.UTF16View 遵循 RandomAccessCollection 协议,两者的时间复杂度应该不同。这里怎么说时间复杂度与 String 是否桥接自 NSString 有关?以下进一步探究。
let s2 = NSString(string: s) as Stringlet loopCount = 10000let index = s.characters.count / 2let index2 = s.characters.count - 1func test(_ s: String) { var date = Date() let utf8 = s.utf8 for _ in 0..测试结果
对比 index 与 index2 的差异。测试参数 index2 约为 index 的 2 倍。UTF-8 index2 的耗时也约为 index 的 2 倍。UTF-16 的 index 和 index2 耗时相近。这与是否遵循 RandomAccessCollection 协议一致。
对比 String 与 NSString 的差异。桥接自 NSString 的 String 耗时比 String 要长,UTF-8 尤其明显。这应该就是文档说明的情况。用 Range 取下标,桥接自 NSString 的 String,比 String 多一些操作,多出 O(n) 级别的时间,而不是取下标的时间复杂度是 O(n)。
应用
具体应用时,选取哪种编码方式、取下标方式?首先,编码方式要看具体应用场景。编码方法不同,字符串的长度可能不同。如果字符串只含英文,比较好办。如果字符串含有中文或 Emoji,选择编码方式就要慎重。注意,NSString 的 length 属性获得的长度对应 UTF-16 编码。
let str = "abc"str.characters.count // 3str.unicodeScalars.count // 3str.utf16.count // 3(str as NSString).length // 3str.utf8.count // 3str.utf8CString.count - 1 // 3strlen(str) // 3let emojiStr = ""emojiStr.characters.count // 1emojiStr.unicodeScalars.count // 2emojiStr.utf16.count // 4(emojiStr as NSString).length // 4emojiStr.utf8.count // 8emojiStr.utf8CString.count - 1 // 8strlen(emojiStr) // 8let ChineseStr = "中文"ChineseStr.characters.count // 2ChineseStr.unicodeScalars.count // 2ChineseStr.utf16.count // 2(ChineseStr as NSString).length // 2ChineseStr.utf8.count // 6ChineseStr.utf8CString.count - 1 // 6strlen(ChineseStr) // 6