- java.lang.Object
-
- java.lang.Character
-
- 实现的所有接口
-
Serializable,Comparable<Character>
public final class Character extends Object implements Serializable, Comparable<Character>
Character类在对象中包装基本类型char的值。 类型为Character的对象包含单个字段,其类型为char。此外,该类提供了几种方法来确定字符的类别(小写字母,数字等)以及将字符从大写转换为小写,反之亦然。
字符信息基于Unicode标准10.0.0版。
类
Character的方法和数据由UnicodeData文件中的信息定义,该文件是Unicode Consortium维护的Unicode字符数据库的一部分。 此文件指定各种属性,包括每个已定义的Unicode代码点或字符范围的名称和常规类别。该文件及其描述可从Unicode Consortium获得:
Unicode Character Representations
char数据类型(因此Character对象封装的值)基于原始Unicode规范,该规范将字符定义为固定宽度的16位实体。 此后,Unicode标准已更改为允许表示形式需要16位以上的字符。 合法代码点 s的范围现在是U + 0000到U + 10FFFF,称为Unicode标量值 。 (请参阅Unicode标准中U + n表示法的 definition. )The set of characters from U+0000 to U+FFFF有时被称为基本多语言平面(BMP) 。 代码点大于U + FFFF的Characters称为补充字符 s。 Java平台使用
char数组和String和StringBuffer类中的UTF-16表示。 在此表示中,补充字符表示为一对char值,第一个来自高代理范围(\ uD800- \ uDBFF),第二个来自低代理范围(\ uDC00- \ uDFFF)。因此,
char值表示基本多语言平面(BMP)代码点,包括代理代码点或UTF-16编码的代码单元。int值表示所有Unicode代码点,包括补充代码点。int的较低(最低有效)21位用于表示Unicode代码点,而较高(最高有效)11位必须为零。 除非另有说明,否则关于补充字符和代理char值的行为如下:- 仅接受
char值的方法不支持增补字符。 它们将代理范围中的char值视为未定义的字符。 例如,Character.isLetter('\uD840')返回false,即使此字符串中的任何低代理值后面的特定值也表示字母。 - 接受
int值的方法支持所有Unicode字符,包括增补字符。 例如,Character.isLetter(0x2F81A)返回true因为代码点值表示一个字母(CJK表意文字)。
在Java SE API文档中, Unicode代码点用于U + 0000和U + 10FFFF之间的字符值, Unicode代码单元用于16位
char值,这些值是UTF-16编码的代码单元。 有关Unicode术语的更多信息,请参阅Unicode Glossary 。- 从以下版本开始:
- 1.0
- 另请参见:
- Serialized Form
-
-
嵌套类汇总
嵌套类 变量和类型 类 描述 static classCharacter.Subset此类的实例表示Unicode字符集的特定子集。static classCharacter.UnicodeBlock一系列字符子集,表示Unicode规范中的字符块。static classCharacter.UnicodeScript一系列字符子集,表示 Unicode Standard Annex #24: Script Names中定义的字符脚本。
-
字段汇总
字段 变量和类型 字段 描述 static intBYTES用于表示无符号二进制形式的char值的字节数。static byteCOMBINING_SPACING_MARKUnicode规范中的常规类别“Mc”。static byteCONNECTOR_PUNCTUATIONUnicode规范中的常规类别“Pc”。static byteCONTROLUnicode规范中的常规类别“Cc”。static byteCURRENCY_SYMBOLUnicode规范中的常规类别“Sc”。static byteDASH_PUNCTUATIONUnicode规范中的常规类别“Pd”。static byteDECIMAL_DIGIT_NUMBERUnicode规范中的常规类别“Nd”。static byteDIRECTIONALITY_ARABIC_NUMBERUnicode规范中的弱双向字符类型“AN”。static byteDIRECTIONALITY_BOUNDARY_NEUTRALUnicode规范中的弱双向字符类型“BN”。static byteDIRECTIONALITY_COMMON_NUMBER_SEPARATORUnicode规范中的弱双向字符类型“CS”。static byteDIRECTIONALITY_EUROPEAN_NUMBERUnicode规范中的弱双向字符类型“EN”。static byteDIRECTIONALITY_EUROPEAN_NUMBER_SEPARATORUnicode规范中的弱双向字符类型“ES”。static byteDIRECTIONALITY_EUROPEAN_NUMBER_TERMINATORUnicode规范中的弱双向字符类型“ET”。static byteDIRECTIONALITY_FIRST_STRONG_ISOLATEUnicode规范中的弱双向字符类型“FSI”。static byteDIRECTIONALITY_LEFT_TO_RIGHTUnicode规范中的强双向字符类型“L”。static byteDIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDINGUnicode规范中的强双向字符类型“LRE”。static byteDIRECTIONALITY_LEFT_TO_RIGHT_ISOLATEUnicode规范中的弱双向字符类型“LRI”。static byteDIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDEUnicode规范中的强双向字符类型“LRO”。static byteDIRECTIONALITY_NONSPACING_MARKUnicode规范中的弱双向字符类型“NSM”。static byteDIRECTIONALITY_OTHER_NEUTRALSUnicode规范中的中性双向字符类型“ON”。static byteDIRECTIONALITY_PARAGRAPH_SEPARATORUnicode规范中的中性双向字符类型“B”。static byteDIRECTIONALITY_POP_DIRECTIONAL_FORMATUnicode规范中的弱双向字符类型“PDF”。static byteDIRECTIONALITY_POP_DIRECTIONAL_ISOLATEUnicode规范中的弱双向字符类型“PDI”。static byteDIRECTIONALITY_RIGHT_TO_LEFTUnicode规范中的强双向字符类型“R”。static byteDIRECTIONALITY_RIGHT_TO_LEFT_ARABICUnicode规范中的强双向字符类型“AL”。static byteDIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDINGUnicode规范中的强双向字符类型“RLE”。static byteDIRECTIONALITY_RIGHT_TO_LEFT_ISOLATEUnicode规范中的弱双向字符类型“RLI”。static byteDIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDEUnicode规范中的强双向字符类型“RLO”。static byteDIRECTIONALITY_SEGMENT_SEPARATORUnicode规范中的中性双向字符类型“S”。static byteDIRECTIONALITY_UNDEFINED未定义的双向字符类型。static byteDIRECTIONALITY_WHITESPACEUnicode规范中的中性双向字符类型“WS”。static byteENCLOSING_MARKUnicode规范中的常规类别“Me”。static byteEND_PUNCTUATIONUnicode规范中的常规类别“Pe”。static byteFINAL_QUOTE_PUNCTUATIONUnicode规范中的常规类别“Pf”。static byteFORMATUnicode规范中的常规类别“Cf”。static byteINITIAL_QUOTE_PUNCTUATIONUnicode规范中的常规类别“Pi”。static byteLETTER_NUMBERUnicode规范中的常规类别“Nl”。static byteLINE_SEPARATORUnicode规范中的常规类别“Zl”。static byteLOWERCASE_LETTERUnicode规范中的常规类别“Ll”。static byteMATH_SYMBOLUnicode规范中的常规类别“Sm”。static intMAX_CODE_POINT最大值为 Unicode code point ,常数U+10FFFF。static charMAX_HIGH_SURROGATEUTF-16编码中的最大值 Unicode high-surrogate code unit ,常量'\uDBFF'。static charMAX_LOW_SURROGATEUTF-16编码中 Unicode low-surrogate code unit的最大值,常量'\uDFFF'。static intMAX_RADIX可用于转换为字符串和从字符串转换的最大基数。static charMAX_SURROGATEUTF-16编码中Unicode代理项代码单元的最大值,常量'\uDFFF'。static charMAX_VALUE此字段的常量值是类型char'\uFFFF'。static intMIN_CODE_POINT最小值 Unicode code point ,常数U+0000。static charMIN_HIGH_SURROGATEUTF-16编码中的最小值 Unicode high-surrogate code unit ,常量'\uD800'。static charMIN_LOW_SURROGATEUTF-16编码中 Unicode low-surrogate code unit的最小值,常量'\uDC00'。static intMIN_RADIX可用于转换为字符串和从字符串转换的最小基数。static intMIN_SUPPLEMENTARY_CODE_POINT最小值 Unicode supplementary code point ,常数U+10000。static charMIN_SURROGATEUTF-16编码中Unicode代理项代码单元的最小值,常量'\uD800'。static charMIN_VALUE此字段的常量值是类型char'\u0000'。static byteMODIFIER_LETTERUnicode规范中的常规类别“Lm”。static byteMODIFIER_SYMBOLUnicode规范中的常规类别“Sk”。static byteNON_SPACING_MARKUnicode规范中的常规类别“Mn”。static byteOTHER_LETTERUnicode规范中的常规类别“Lo”。static byteOTHER_NUMBERUnicode规范中的常规类别“否”。static byteOTHER_PUNCTUATIONUnicode规范中的常规类别“Po”。static byteOTHER_SYMBOLUnicode规范中的常规类别“So”。static bytePARAGRAPH_SEPARATORUnicode规范中的常规类别“Zp”。static bytePRIVATE_USEUnicode规范中的常规类别“Co”。static intSIZE用于表示无符号二进制形式的char值的位数,常量16。static byteSPACE_SEPARATORUnicode规范中的常规类别“Zs”。static byteSTART_PUNCTUATIONUnicode规范中的常规类别“Ps”。static byteSURROGATEUnicode规范中的常规类别“Cs”。static byteTITLECASE_LETTERUnicode规范中的常规类别“Lt”。static 类<Character>TYPE类实例表示基本类型char。static byteUNASSIGNEDUnicode规范中的常规类别“Cn”。static byteUPPERCASE_LETTERUnicode规范中的常规类别“Lu”。
-
构造方法摘要
构造方法 构造器 描述 Character(char value)已过时。使用此构造函数很少是合适的。
-
方法摘要
所有方法 静态方法 实例方法 具体的方法 弃用的方法 变量和类型 方法 描述 static intcharCount(int codePoint)确定表示指定字符(Unicode代码点)所需的char值的数量。charcharValue()返回此Character对象的值。static intcodePointAt(char[] a, int index)返回char数组的给定索引处的代码点。static intcodePointAt(char[] a, int index, int limit)返回char数组的给定索引处的代码点,其中只能使用index小于limit数组元素。static intcodePointAt(CharSequence seq, int index)返回CharSequence的给定索引处的代码点。static intcodePointBefore(char[] a, int index)返回char数组的给定索引之前的代码点。static intcodePointBefore(char[] a, int index, int start)返回char数组的给定索引之前的代码点,其中只能使用index大于或等于start数组元素。static intcodePointBefore(CharSequence seq, int index)返回CharSequence的给定索引之前的代码点。static intcodePointCount(char[] a, int offset, int count)返回char数组参数的子数组中的Unicode代码点数。static intcodePointCount(CharSequence seq, int beginIndex, int endIndex)返回指定char序列的文本范围内的Unicode代码点数。static intcodePointOf(String name)返回给定Unicode字符名称指定的Unicode字符的代码点值。static intcompare(char x, char y)以数字方式比较两个char值。intcompareTo(Character anotherCharacter)以数字方式比较两个Character对象。static intdigit(char ch, int radix)返回指定基数中的字符ch的数值。static intdigit(int codePoint, int radix)返回指定基数中指定字符(Unicode代码点)的数值。booleanequals(Object obj)将此对象与指定的对象进行比较。static charforDigit(int digit, int radix)确定指定基数中特定数字的字符表示形式。static bytegetDirectionality(char ch)返回给定字符的Unicode方向性属性。static bytegetDirectionality(int codePoint)返回给定字符的Unicode方向性属性(Unicode代码点)。static StringgetName(int codePoint)返回指定字符codePoint的Unicode名称,如果代码点为unassigned,则返回null。static intgetNumericValue(char ch)返回指定的Unicode字符表示的int值。static intgetNumericValue(int codePoint)返回指定字符(Unicode代码点)表示的int值。static intgetType(char ch)返回表示字符常规类别的值。static intgetType(int codePoint)返回表示字符常规类别的值。inthashCode()返回此Character的哈希码; 等于调用charValue()的结果。static inthashCode(char value)返回char值的哈希码; 与Character.hashCode()兼容。static charhighSurrogate(int codePoint)返回主导替代(一个 high surrogate code unit所述的) surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。static booleanisAlphabetic(int codePoint)确定指定的字符(Unicode代码点)是否为字母。static booleanisBmpCodePoint(int codePoint)确定指定的字符(Unicode代码点)是否在 Basic Multilingual Plane (BMP)中 。static booleanisDefined(char ch)确定是否在Unicode中定义了字符。static booleanisDefined(int codePoint)确定是否在Unicode中定义了字符(Unicode代码点)。static booleanisDigit(char ch)确定指定的字符是否为数字。static booleanisDigit(int codePoint)确定指定的字符(Unicode代码点)是否为数字。static booleanisHighSurrogate(char ch)确定给定的char值是否为 Unicode high-surrogate code unit (也称为 前导代理代码单元 )。static booleanisIdentifierIgnorable(char ch)确定指定的字符是否应被视为Java标识符或Unicode标识符中的可忽略字符。static booleanisIdentifierIgnorable(int codePoint)确定指定的字符(Unicode代码点)是否应被视为Java标识符或Unicode标识符中的可忽略字符。static booleanisIdeographic(int codePoint)确定指定的字符(Unicode代码点)是否为Unicode标准定义的CJKV(中文,日文,韩文和越南文)表意文字。static booleanisISOControl(char ch)确定指定的字符是否为ISO控制字符。static booleanisISOControl(int codePoint)确定引用的字符(Unicode代码点)是否为ISO控制字符。static booleanisJavaIdentifierPart(char ch)确定指定的字符是否可能是Java标识符的一部分,而不是第一个字符。static booleanisJavaIdentifierPart(int codePoint)确定字符(Unicode代码点)是否可能是Java标识符的一部分,而不是第一个字符。static booleanisJavaIdentifierStart(char ch)确定指定的字符是否允许作为Java标识符中的第一个字符。static booleanisJavaIdentifierStart(int codePoint)确定字符(Unicode代码点)是否允许作为Java标识符中的第一个字符。static booleanisJavaLetter(char ch)已过时。替换为isJavaIdentifierStart(char)。static booleanisJavaLetterOrDigit(char ch)已过时。替换为isJavaIdentifierPart(char)。static booleanisLetter(char ch)确定指定的字符是否为字母。static booleanisLetter(int codePoint)确定指定的字符(Unicode代码点)是否为字母。static booleanisLetterOrDigit(char ch)确定指定的字符是字母还是数字。static booleanisLetterOrDigit(int codePoint)确定指定的字符(Unicode代码点)是字母还是数字。static booleanisLowerCase(char ch)确定指定的字符是否为小写字符。static booleanisLowerCase(int codePoint)确定指定的字符(Unicode代码点)是否为小写字符。static booleanisLowSurrogate(char ch)确定给定的char值是否为 Unicode low-surrogate code unit (也称为 trailing-surrogate代码单元 )。static booleanisMirrored(char ch)确定是否根据Unicode规范镜像该字符。static booleanisMirrored(int codePoint)确定是否根据Unicode规范镜像指定的字符(Unicode代码点)。static booleanisSpace(char ch)已过时。替换为isWhitespace(char)。static booleanisSpaceChar(char ch)确定指定的字符是否为Unicode空格字符。static booleanisSpaceChar(int codePoint)确定指定的字符(Unicode代码点)是否为Unicode空格字符。static booleanisSupplementaryCodePoint(int codePoint)确定指定的字符(Unicode代码点)是否在 supplementary character范围内。static booleanisSurrogate(char ch)确定给定的char值是否为Unicode 代理代码单元 。static booleanisSurrogatePair(char high, char low)确定指定的char值对是否为有效 Unicode surrogate pair 。static booleanisTitleCase(char ch)确定指定的字符是否为标题字符。static booleanisTitleCase(int codePoint)确定指定的字符(Unicode代码点)是否为标题字符。static booleanisUnicodeIdentifierPart(char ch)确定指定的字符是否可能是Unicode标识符的一部分,而不是第一个字符。static booleanisUnicodeIdentifierPart(int codePoint)确定指定的字符(Unicode代码点)是否可能是Unicode标识符的一部分,而不是第一个字符。static booleanisUnicodeIdentifierStart(char ch)确定指定的字符是否允许作为Unicode标识符中的第一个字符。static booleanisUnicodeIdentifierStart(int codePoint)确定是否允许指定的字符(Unicode代码点)作为Unicode标识符中的第一个字符。static booleanisUpperCase(char ch)确定指定的字符是否为大写字符。static booleanisUpperCase(int codePoint)确定指定的字符(Unicode代码点)是否为大写字符。static booleanisValidCodePoint(int codePoint)确定指定的代码点是否有效 Unicode code point value 。static booleanisWhitespace(char ch)根据Java确定指定的字符是否为空格。static booleanisWhitespace(int codePoint)根据Java确定指定的字符(Unicode代码点)是否为空白。static charlowSurrogate(int codePoint)返回尾随替代(一个 low surrogate code unit所述的) surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。static intoffsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)返回给定的索引char子阵是从给定的偏移index由codePointOffset代码点。static intoffsetByCodePoints(CharSequence seq, int index, int codePointOffset)返回给定char序列中的索引,该索引从给定的index偏移codePointOffset代码点。static charreverseBytes(char ch)返回通过反转指定的char值中的字节顺序获得的值。static char[]toChars(int codePoint)将指定字符(Unicode代码点)转换为存储在char数组中的UTF-16表示形式。static inttoChars(int codePoint, char[] dst, int dstIndex)将指定字符(Unicode代码点)转换为其UTF-16表示形式。static inttoCodePoint(char high, char low)将指定的代理项对转换为其补充代码点值。static chartoLowerCase(char ch)使用UnicodeData文件中的大小写映射信息将字符参数转换为小写。static inttoLowerCase(int codePoint)使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为小写。StringtoString()返回表示此Character值的String对象。static StringtoString(char c)返回表示指定的char的String对象。static StringtoString(int codePoint)返回表示指定字符(Unicode代码点)的String对象。static chartoTitleCase(char ch)使用UnicodeData文件中的大小写映射信息将字符参数转换为标题。static inttoTitleCase(int codePoint)使用UnicodeData文件中的案例映射信息将字符(Unicode代码点)参数转换为titlecase。static chartoUpperCase(char ch)使用UnicodeData文件中的大小写映射信息将字符参数转换为大写。static inttoUpperCase(int codePoint)使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为大写。static CharactervalueOf(char c)返回表示指定的char值的Character实例。
-
-
-
字段详细信息
-
MIN_RADIX
public static final int MIN_RADIX
可用于转换为字符串和从字符串转换的最小基数。 该字段的常量值是基数转换方法中的基数参数允许的最小值,例如digit方法,forDigit方法和toString类Integer方法。
-
MAX_RADIX
public static final int MAX_RADIX
可用于转换为字符串和从字符串转换的最大基数。 该字段的常量值是基数转换方法中的基数参数允许的digit,例如digit方法,forDigit方法和toString类Integer方法。
-
MIN_VALUE
public static final char MIN_VALUE
此字段的常量值是类型char'\u0000'。- 从以下版本开始:
- 1.0.2
- 另请参见:
- 常数字段值
-
MAX_VALUE
public static final char MAX_VALUE
此字段的常量值是类型char'\uFFFF'。- 从以下版本开始:
- 1.0.2
- 另请参见:
- 常数字段值
-
UNASSIGNED
public static final byte UNASSIGNED
Unicode规范中的常规类别“Cn”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
UPPERCASE_LETTER
public static final byte UPPERCASE_LETTER
Unicode规范中的常规类别“Lu”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
LOWERCASE_LETTER
public static final byte LOWERCASE_LETTER
Unicode规范中的常规类别“Ll”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
TITLECASE_LETTER
public static final byte TITLECASE_LETTER
Unicode规范中的常规类别“Lt”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
MODIFIER_LETTER
public static final byte MODIFIER_LETTER
Unicode规范中的常规类别“Lm”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
OTHER_LETTER
public static final byte OTHER_LETTER
Unicode规范中的常规类别“Lo”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
NON_SPACING_MARK
public static final byte NON_SPACING_MARK
Unicode规范中的常规类别“Mn”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
ENCLOSING_MARK
public static final byte ENCLOSING_MARK
Unicode规范中的常规类别“Me”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
COMBINING_SPACING_MARK
public static final byte COMBINING_SPACING_MARK
Unicode规范中的常规类别“Mc”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
DECIMAL_DIGIT_NUMBER
public static final byte DECIMAL_DIGIT_NUMBER
Unicode规范中的常规类别“Nd”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
LETTER_NUMBER
public static final byte LETTER_NUMBER
Unicode规范中的常规类别“Nl”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
OTHER_NUMBER
public static final byte OTHER_NUMBER
Unicode规范中的常规类别“否”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
SPACE_SEPARATOR
public static final byte SPACE_SEPARATOR
Unicode规范中的常规类别“Zs”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
LINE_SEPARATOR
public static final byte LINE_SEPARATOR
Unicode规范中的常规类别“Zl”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
PARAGRAPH_SEPARATOR
public static final byte PARAGRAPH_SEPARATOR
Unicode规范中的常规类别“Zp”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
CONTROL
public static final byte CONTROL
Unicode规范中的常规类别“Cc”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
FORMAT
public static final byte FORMAT
Unicode规范中的常规类别“Cf”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
PRIVATE_USE
public static final byte PRIVATE_USE
Unicode规范中的常规类别“Co”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
SURROGATE
public static final byte SURROGATE
Unicode规范中的常规类别“Cs”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
DASH_PUNCTUATION
public static final byte DASH_PUNCTUATION
Unicode规范中的常规类别“Pd”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
START_PUNCTUATION
public static final byte START_PUNCTUATION
Unicode规范中的常规类别“Ps”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
END_PUNCTUATION
public static final byte END_PUNCTUATION
Unicode规范中的常规类别“Pe”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
CONNECTOR_PUNCTUATION
public static final byte CONNECTOR_PUNCTUATION
Unicode规范中的常规类别“Pc”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
OTHER_PUNCTUATION
public static final byte OTHER_PUNCTUATION
Unicode规范中的常规类别“Po”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
MATH_SYMBOL
public static final byte MATH_SYMBOL
Unicode规范中的常规类别“Sm”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
CURRENCY_SYMBOL
public static final byte CURRENCY_SYMBOL
Unicode规范中的常规类别“Sc”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
MODIFIER_SYMBOL
public static final byte MODIFIER_SYMBOL
Unicode规范中的常规类别“Sk”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
OTHER_SYMBOL
public static final byte OTHER_SYMBOL
Unicode规范中的常规类别“So”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
INITIAL_QUOTE_PUNCTUATION
public static final byte INITIAL_QUOTE_PUNCTUATION
Unicode规范中的常规类别“Pi”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
FINAL_QUOTE_PUNCTUATION
public static final byte FINAL_QUOTE_PUNCTUATION
Unicode规范中的常规类别“Pf”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_UNDEFINED
public static final byte DIRECTIONALITY_UNDEFINED
未定义的双向字符类型。 未定义的char值在Unicode规范中具有未定义的方向性。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_LEFT_TO_RIGHT
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
Unicode规范中的强双向字符类型“L”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_RIGHT_TO_LEFT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
Unicode规范中的强双向字符类型“R”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
Unicode规范中的强双向字符类型“AL”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_EUROPEAN_NUMBER
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
Unicode规范中的弱双向字符类型“EN”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
Unicode规范中的弱双向字符类型“ES”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
Unicode规范中的弱双向字符类型“ET”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_ARABIC_NUMBER
public static final byte DIRECTIONALITY_ARABIC_NUMBER
Unicode规范中的弱双向字符类型“AN”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
Unicode规范中的弱双向字符类型“CS”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_NONSPACING_MARK
public static final byte DIRECTIONALITY_NONSPACING_MARK
Unicode规范中的弱双向字符类型“NSM”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_BOUNDARY_NEUTRAL
public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
Unicode规范中的弱双向字符类型“BN”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_PARAGRAPH_SEPARATOR
public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
Unicode规范中的中性双向字符类型“B”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_SEGMENT_SEPARATOR
public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
Unicode规范中的中性双向字符类型“S”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_WHITESPACE
public static final byte DIRECTIONALITY_WHITESPACE
Unicode规范中的中性双向字符类型“WS”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_OTHER_NEUTRALS
public static final byte DIRECTIONALITY_OTHER_NEUTRALS
Unicode规范中的中性双向字符类型“ON”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
Unicode规范中的强双向字符类型“LRE”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
Unicode规范中的强双向字符类型“LRO”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
Unicode规范中的强双向字符类型“RLE”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
Unicode规范中的强双向字符类型“RLO”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
Unicode规范中的弱双向字符类型“PDF”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
Unicode规范中的弱双向字符类型“LRI”。- 从以下版本开始:
- 9
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
Unicode规范中的弱双向字符类型“RLI”。- 从以下版本开始:
- 9
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_FIRST_STRONG_ISOLATE
public static final byte DIRECTIONALITY_FIRST_STRONG_ISOLATE
Unicode规范中的弱双向字符类型“FSI”。- 从以下版本开始:
- 9
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
Unicode规范中的弱双向字符类型“PDI”。- 从以下版本开始:
- 9
- 另请参见:
- 常数字段值
-
MIN_HIGH_SURROGATE
public static final char MIN_HIGH_SURROGATE
UTF-16编码中Unicode high-surrogate code unit的最小值,常量'\uD800'。 高代理人也被称为领导代理人 。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MAX_HIGH_SURROGATE
public static final char MAX_HIGH_SURROGATE
UTF-16编码中的最大值为Unicode high-surrogate code unit ,常量为'\uDBFF'。 高代理人也被称为领导代理人 。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MIN_LOW_SURROGATE
public static final char MIN_LOW_SURROGATE
UTF-16编码中Unicode low-surrogate code unit的最小值,常量'\uDC00'。 低代理也被称为尾随代理 。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MAX_LOW_SURROGATE
public static final char MAX_LOW_SURROGATE
UTF-16编码中的最大值Unicode low-surrogate code unit ,常量'\uDFFF'。 低代理也被称为尾随代理 。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MIN_SURROGATE
public static final char MIN_SURROGATE
UTF-16编码中Unicode代理项代码单元的最小值,常量'\uD800'。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MAX_SURROGATE
public static final char MAX_SURROGATE
UTF-16编码中Unicode代理项代码单元的最大值,常量'\uDFFF'。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MIN_SUPPLEMENTARY_CODE_POINT
public static final int MIN_SUPPLEMENTARY_CODE_POINT
最小值 Unicode supplementary code point ,常数U+10000。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MIN_CODE_POINT
public static final int MIN_CODE_POINT
最小值 Unicode code point ,常数U+0000。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MAX_CODE_POINT
public static final int MAX_CODE_POINT
最大值 Unicode code point ,常数U+10FFFF。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
SIZE
public static final int SIZE
用于表示无符号二进制形式的char值的位数,常量16。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
BYTES
public static final int BYTES
用于表示无符号二进制形式的char值的字节数。- 从以下版本开始:
- 1.8
- 另请参见:
- 常数字段值
-
-
构造方法详细信息
-
Character
@Deprecated(since="9") public Character(char value)
Deprecated.It is rarely appropriate to use this constructor. The static factoryvalueOf(char)is generally a better choice, as it is likely to yield significantly better space and time performance.构造一个新分配的Character对象,该对象表示指定的char值。- 参数
-
value- 要由Character对象表示的值。
-
-
方法详细信息
-
valueOf
public static Character valueOf(char c)
返回表示指定的char值的Character实例。 如果不需要新的Character实例,则通常应优先使用此方法,而不是构造函数Character(char),因为此方法可能通过缓存频繁请求的值来显着提高空间和时间性能。 此方法将始终缓存'\u0000'至'\u007F'范围内的值,并且可以缓存此范围之外的其他值。- 参数
-
c- char值。 - 结果
-
Character实例,代表c。 - 从以下版本开始:
- 1.5
-
charValue
public char charValue()
返回此Character对象的值。- 结果
-
此对象表示的原始值
char。
-
hashCode
public int hashCode()
返回此Character的哈希码; 等于调用charValue()的结果。- 重写:
-
hashCode类Object - 结果
-
此
Character的哈希码值 - 另请参见:
-
Object.equals(java.lang.Object),System.identityHashCode(java.lang.Object)
-
hashCode
public static int hashCode(char value)
返回char值的哈希码; 与Character.hashCode()兼容。- 参数
-
value- 要为其返回哈希码的char。 - 结果
-
char值的哈希码值。 - 从以下版本开始:
- 1.8
-
equals
public boolean equals(Object obj)
将此对象与指定的对象进行比较。 当且仅当参数不是null并且是Character对象时,结果为true,该对象表示与此对象相同的char值。- 重写:
-
equals在类Object - 参数
-
obj- 要与之比较的对象。 - 结果
-
true如果对象相同; 否则为false。 - 另请参见:
-
Object.hashCode(),HashMap
-
toString
public String toString()
返回表示此Character值的String对象。 其结果是长度为1的串,其唯一分量是原始char由该表示值Character对象。
-
toString
public static String toString(char c)
返回表示指定的char的String对象。 结果是一个长度为1的字符串,仅由指定的char。- API Note:
-
此方法无法处理supplementary characters 。
要支持所有Unicode字符(包括增补字符),请使用
toString(int)方法。 - 参数
-
c- 要转换的char - 结果
-
指定的
char的字符串表示char - 从以下版本开始:
- 1.4
-
toString
public static String toString(int codePoint)
返回表示指定字符(Unicode代码点)的String对象。 结果是一个长度为1或2的字符串,仅由指定的codePoint。- 参数
-
codePoint- 要转换的codePoint - 结果
-
指定的
codePoint的字符串表示codePoint - 异常
-
IllegalArgumentException- 如果指定的codePoint不是 valid Unicode code point 。 - 从以下版本开始:
- 11
-
isValidCodePoint
public static boolean isValidCodePoint(int codePoint)
确定指定的代码点是否有效 Unicode code point value 。- 参数
-
codePoint- 要测试的Unicode代码点 - 结果
-
true如果指定的代码点值介于MIN_CODE_POINT和MAX_CODE_POINT之间; 否则为false。 - 从以下版本开始:
- 1.5
-
isBmpCodePoint
public static boolean isBmpCodePoint(int codePoint)
确定指定的字符(Unicode代码点)是否在Basic Multilingual Plane (BMP)中 。 这些代码点可以使用单个char表示。
-
isSupplementaryCodePoint
public static boolean isSupplementaryCodePoint(int codePoint)
确定指定的字符(Unicode代码点)是否在 supplementary character范围内。- 参数
-
codePoint- 要测试的字符(Unicode代码点) - 结果
-
true如果指定的代码点介于MIN_SUPPLEMENTARY_CODE_POINT和MAX_CODE_POINT之间; 否则为false。 - 从以下版本开始:
- 1.5
-
isHighSurrogate
public static boolean isHighSurrogate(char ch)
确定给定的char值是否为Unicode high-surrogate code unit (也称为前导代理代码单元 )。这些值本身不代表字符,但在UTF-16编码中用于表示supplementary characters 。
- 参数
-
ch- 要测试的char值。 - 结果
-
true如果char值介于MIN_HIGH_SURROGATE和MAX_HIGH_SURROGATE之间; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isLowSurrogate(char),Character.UnicodeBlock.of(int)
-
isLowSurrogate
public static boolean isLowSurrogate(char ch)
确定给定的char值是否为Unicode low-surrogate code unit (也称为trailing-surrogate代码单元 )。这些值本身不代表字符,但在UTF-16编码中以supplementary characters的表示形式使用。
- 参数
-
ch- 要测试的值char。 - 结果
-
true如果char值介于MIN_LOW_SURROGATE和MAX_LOW_SURROGATE之间; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isHighSurrogate(char)
-
isSurrogate
public static boolean isSurrogate(char ch)
确定给定的char值是否为Unicode 代理代码单元 。这些值本身不代表字符,但在UTF-16编码中用于表示supplementary characters 。
char值是代理代码单元,当且仅当它是low-surrogate code unit或high-surrogate code unit时 。
- 参数
-
ch- 要测试的char值。 - 结果
-
true如果char值介于MIN_SURROGATE和MAX_SURROGATE之间; 否则为false。 - 从以下版本开始:
- 1.7
-
isSurrogatePair
public static boolean isSurrogatePair(char high, char low)- 参数
-
high- 要测试的高代理代码值 -
low- 要测试的低代理代码值 - 结果
-
true如果指定的高代理代理值和低代理代码值代表有效的代理对; 否则为false。 - 从以下版本开始:
- 1.5
-
charCount
public static int charCount(int codePoint)
确定表示指定字符(Unicode代码点)所需的char值的数量。 如果指定的字符等于或大于0x10000,则该方法返回2.否则,该方法返回1。此方法不会将指定的字符验证为有效的Unicode代码点。 如有必要,调用者必须使用
isValidCodePoint验证字符值。- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
- 2如果角色是有效的补充角色; 否则为1。
- 从以下版本开始:
- 1.5
- 另请参见:
-
isSupplementaryCodePoint(int)
-
toCodePoint
public static int toCodePoint(char high, char low)- 参数
-
high- 高代理代码单元 -
low- 低代理代码单元 - 结果
- 由指定的代理对组成的补充代码点。
- 从以下版本开始:
- 1.5
-
codePointAt
public static int codePointAt(CharSequence seq, int index)
返回CharSequence的给定索引处的代码点。 如果char给定索引处的值CharSequence处于高代理项范围,下列指数小于所述长度CharSequence,并且char以下索引处的值是在低代理项范围内,则所述辅助返回与此代理项对相对应的代码点。 否则,返回给定索引处的char值。- 参数
-
seq- 一系列char值(Unicode代码单元) -
index- 要转换的char值(Unicode代码单位)的seq - 结果
- 给定索引处的Unicode代码点
- 异常
-
NullPointerException- 如果seq为空。 -
IndexOutOfBoundsException- 如果值index为负数或不小于seq.length()。 - 从以下版本开始:
- 1.5
-
codePointAt
public static int codePointAt(char[] a, int index)返回char数组的给定索引处的代码点。 如果char数组中给定索引处的char值处于高代理范围内,则以下索引小于char数组的长度,并且以下索引处的char值处于低代理范围内,则返回与该代理对相对应的补充代码点。 否则,返回给定索引处的char值。- 参数
-
a- 数组char -
index- 要转换的char数组中char值(Unicode代码单位)的char - 结果
- 给定索引处的Unicode代码点
- 异常
-
NullPointerException- 如果a为空。 -
IndexOutOfBoundsException- 如果值index为负数或不小于char数组的长度。 - 从以下版本开始:
- 1.5
-
codePointAt
public static int codePointAt(char[] a, int index, int limit)返回char数组的给定索引处的代码点,其中只能使用index小于limit数组元素。 如果char数组中给定索引处的char值处于高代理范围内,则以下索引小于limit,并且以下索引处的char值处于低代理范围,然后是补充代码点对应于此代理项对返回。 否则,返回给定索引处的char值。- 参数
-
a-char数组 -
index- 要转换的char数组中char值(Unicode代码单位)的char -
limit- 可在char数组中使用的最后一个数组元素之后的索引 - 结果
- 给定索引处的Unicode代码点
- 异常
-
NullPointerException- 如果a为空。 -
IndexOutOfBoundsException- 如果index参数为负或不小于limit参数,或者limit参数为负或大于char数组的长度。 - 从以下版本开始:
- 1.5
-
codePointBefore
public static int codePointBefore(CharSequence seq, int index)
返回CharSequence的给定索引之前的代码点。 如果char在值(index - 1)在CharSequence处于低代理项范围,(index - 2)不为负,并且char在值(index - 2)在CharSequence处于高代理项范围内,则对应于该代理对的增补代码点是回。 否则,返回char值(index - 1)。- 参数
-
seq-CharSequence实例 -
index- 应返回的代码点后面的索引 - 结果
- 给定索引之前的Unicode代码点值。
- 异常
-
NullPointerException- 如果seq为空。 -
IndexOutOfBoundsException- 如果index参数小于1或大于seq.length()。 - 从以下版本开始:
- 1.5
-
codePointBefore
public static int codePointBefore(char[] a, int index)返回char数组的给定索引之前的代码点。 如果char在值(index - 1)中char阵列是在低代理项范围,(index - 2)不为负,并且char在值(index - 2)中char阵列在高代理项范围内,则对应于该替代的增补代码点对返回。 否则,返回char值(index - 1)。- 参数
-
a-char数组 -
index- 应返回的代码点后面的索引 - 结果
- 给定索引之前的Unicode代码点值。
- 异常
-
NullPointerException- 如果a为空。 -
IndexOutOfBoundsException- 如果index参数小于1或大于char数组的长度 - 从以下版本开始:
- 1.5
-
codePointBefore
public static int codePointBefore(char[] a, int index, int start)返回char数组的给定索引之前的代码点,其中只能使用index大于或等于start数组元素。 如果char在值(index - 1)中char阵列是在低代理项范围,(index - 2)不小于start,并且char在值(index - 2)中char阵列在高代理项范围内,则对应于所述补充代码点这个替代对被退回。 否则,返回char值(index - 1)。- 参数
-
a-char数组 -
index- 应返回的代码点后面的索引 -
start-char数组中第一个数组元素的char - 结果
- 给定索引之前的Unicode代码点值。
- 异常
-
NullPointerException- 如果a为空。 -
IndexOutOfBoundsException- 如果index参数不大于start参数或大于char数组的长度,或者start参数为负或不小于char数组的长度。 - 从以下版本开始:
- 1.5
-
highSurrogate
public static char highSurrogate(int codePoint)
返回主导替代(一个high surrogate code unit所述的) surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。 如果指定的字符不是supplementary character ,则返回未指定的char。如果
isSupplementaryCodePoint(x)是true,则isHighSurrogate(highSurrogate(x))和toCodePoint(highSurrogate(x),lowSurrogate(x)) == x也总是true。- 参数
-
codePoint- 补充字符(Unicode代码点) - 结果
- 用于表示UTF-16编码中的字符的前导代理代码单元
- 从以下版本开始:
- 1.7
-
lowSurrogate
public static char lowSurrogate(int codePoint)
返回尾随替代(一个low surrogate code unit所述的) surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。 如果指定的字符不是supplementary character ,则返回未指定的char。如果
isSupplementaryCodePoint(x)是true,那么isLowSurrogate(lowSurrogate(x))和toCodePoint(highSurrogate(x), lowSurrogate(x)) == x也总是true。- 参数
-
codePoint- 补充字符(Unicode代码点) - 结果
- 尾随代理代码单元,用于表示UTF-16编码中的字符
- 从以下版本开始:
- 1.7
-
toChars
public static int toChars(int codePoint, char[] dst, int dstIndex)将指定字符(Unicode代码点)转换为其UTF-16表示形式。 如果指定的代码点是BMP(基本多语言平面或平面0)值,则相同的值存储在dst[dstIndex],并返回1。 如果指定的代码点是补充字符,则其代理值存储在dst[dstIndex](high-surrogate)和dst[dstIndex+1](low-surrogate)中,并返回2。- 参数
-
codePoint- 要转换的字符(Unicode代码点)。 -
dst-的阵列char,其中codePoint的UTF-16值被存储。 -
dstIndex- 存储转换值的dst数组的起始索引。 - 结果
- 如果代码点是BMP代码点,则为1;如果代码点是补充代码点,则为2。
- 异常
-
IllegalArgumentException- 如果指定的codePoint不是有效的Unicode代码点。 -
NullPointerException- 如果指定的dst为空。 -
IndexOutOfBoundsException- 如果dstIndex为负数或不小于dst.length,或者如果dst在dstIndex没有足够的数组元素来存储生成的char值。 (如果dstIndex等于dst.length-1且指定的codePoint是补充字符,则高代理值不会存储在dst[dstIndex]。) - 从以下版本开始:
- 1.5
-
toChars
public static char[] toChars(int codePoint)
将指定字符(Unicode代码点)转换为存储在char数组中的UTF-16表示形式。 如果指定的代码点是BMP(基本多语言平面或平面0)值,则生成的char数组具有与codePoint相同的值。 如果指定的代码点是补充代码点,则生成的char数组具有相应的代理项对。- 参数
-
codePoint- Unicode代码点 - 结果
-
具有
codePoint的UTF-16表示的char阵列。 - 异常
-
IllegalArgumentException- 如果指定的codePoint不是有效的Unicode代码点。 - 从以下版本开始:
- 1.5
-
codePointCount
public static int codePointCount(CharSequence seq, int beginIndex, int endIndex)
返回指定char序列的文本范围内的Unicode代码点数。 文本范围开始在指定的beginIndex,并延伸到char在索引endIndex - 1。 因此,文本范围的长度(在chars中)是endIndex-beginIndex。 文本范围内的未配对代理计为每个代码点。- 参数
-
seq- 字符序列 -
beginIndex- 文本范围的第一个char的索引。 -
endIndex- 文本范围的最后char之后的索引。 - 结果
- 指定文本范围内的Unicode代码点数
- 异常
-
NullPointerException- 如果seq为空。 -
IndexOutOfBoundsException- 如果beginIndex为负数,或者endIndex大于给定序列的长度,或者beginIndex大于endIndex。 - 从以下版本开始:
- 1.5
-
codePointCount
public static int codePointCount(char[] a, int offset, int count)返回char数组参数的子数组中的Unicode代码点数。offset参数是子阵列的第一个char的索引,count参数指定charschar阵列的长度。 子阵列中的未配对代理计为每个代码点。- 参数
-
a-char数组 -
offset- 给定char数组中第一个char的索引 -
count-char阵列的长度 - 结果
- 指定子数组中的Unicode代码点数
- 异常
-
NullPointerException- 如果a为空。 -
IndexOutOfBoundsException- 如果offset或count为负数,或者offset + count大于给定数组的长度。 - 从以下版本开始:
- 1.5
-
offsetByCodePoints
public static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
返回给定char序列中的索引,该索引从给定的index偏移codePointOffset代码点。index和codePointOffset给出的文本范围内的未配对代理计为每个代码点。- 参数
-
seq- 字符序列 -
index- 要偏移的索引 -
codePointOffset- 代码点中的偏移量 - 结果
- char序列中的索引
- 异常
-
NullPointerException- 如果seq为空。 -
IndexOutOfBoundsException- 如果index为负数或大于char序列的长度,或者如果codePointOffset为正且从index开始的子index少于codePointOffset代码点,或者如果codePointOffset为负且index之前的子index小于绝对值codePointOffset代码点。 - 从以下版本开始:
- 1.5
-
offsetByCodePoints
public static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)返回给定的索引char子阵是从给定的偏移index由codePointOffset代码点。start和count参数指定char数组的子数组。 由index和codePointOffset给出的文本范围内的未配对代理计为每个代码点。- 参数
-
a-char数组 -
start- 子阵列的第一个char的索引 -
count-char阵列的长度 -
index- 要偏移的索引 -
codePointOffset- 代码点中的偏移量 - 结果
- 子阵列中的索引
- 异常
-
NullPointerException- 如果a为空。 -
IndexOutOfBoundsException- 如果start或count为负数,或者如果start + count大于给定数组的长度,或者index小于start或更大,那么start + count,或者codePointOffset为正且文本范围以index并以start + count - 1结尾有少于codePointOffset代码点,或者如果codePointOffset为负且文本范围开始start,结束时用index - 1具有比的绝对值较少codePointOffset代码点。 - 从以下版本开始:
- 1.5
-
isLowerCase
public static boolean isLowerCase(char ch)
确定指定的字符是否为小写字符。如果
Character.getType(ch)提供的常规类别类型为LOWERCASE_LETTER,或者它具有Unicode标准定义的贡献属性Other_Lowercase,则该字符为小写。以下是小写字符的示例:
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
许多其他Unicode字符也是小写的。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isLowerCase(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
true如果字符是小写的; 否则为false。 - 另请参见:
-
isLowerCase(char),isTitleCase(char),toLowerCase(char),getType(char)
-
isLowerCase
public static boolean isLowerCase(int codePoint)
确定指定的字符(Unicode代码点)是否为小写字符。如果字符的常规类别类型(由
getType(codePoint)提供)为LOWERCASE_LETTER,或者它具有Unicode标准定义的贡献属性Other_Lowercase,则该字符为小写。以下是小写字符的示例:
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
许多其他Unicode字符也是小写的。
- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果字符是小写的; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isLowerCase(int),isTitleCase(int),toLowerCase(int),getType(int)
-
isUpperCase
public static boolean isUpperCase(char ch)
确定指定的字符是否为大写字符。一个字符大写如果其一般类别类型,通过提供
Character.getType(ch),是UPPERCASE_LETTER。 或者它具有Unicode标准定义的贡献属性Other_Uppercase。以下是大写字符的示例:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
许多其他Unicode字符也是大写的。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isUpperCase(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
true如果字符是大写的; 否则为false。 - 从以下版本开始:
- 1.0
- 另请参见:
-
isLowerCase(char),isTitleCase(char),toUpperCase(char),getType(char)
-
isUpperCase
public static boolean isUpperCase(int codePoint)
确定指定的字符(Unicode代码点)是否为大写字符。如果字符的一般类别类型(由
getType(codePoint)提供)为UPPERCASE_LETTER,或者它具有Unicode标准定义的贡献属性Other_Uppercase,则该字符为大写。以下是大写字符的示例:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
许多其他Unicode字符也是大写的。
- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果字符是大写的; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isLowerCase(int),isTitleCase(int),toUpperCase(int),getType(int)
-
isTitleCase
public static boolean isTitleCase(char ch)
确定指定的字符是否为标题字符。字符是否为标题字符,如果它的一般类别类型,通过提供
Character.getType(ch),是TITLECASE_LETTER。有些字符看起来像一对拉丁字母。 例如,有一个大写字母,看起来像“LJ”,并有一个相应的小写字母,看起来像“lj”。 第三种形式,看起来像“Lj”,是使用初始大写以小写形式呈现单词时使用的适当形式,如书名。
这些是此方法返回
true一些Unicode字符:-
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON -
LATIN CAPITAL LETTER L WITH SMALL LETTER J -
LATIN CAPITAL LETTER N WITH SMALL LETTER J -
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
许多其他Unicode字符也是标题。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isTitleCase(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
true如果角色是标题; 否则为false。 - 从以下版本开始:
- 1.0.2
- 另请参见:
-
isLowerCase(char),isUpperCase(char),toTitleCase(char),getType(char)
-
-
isTitleCase
public static boolean isTitleCase(int codePoint)
确定指定的字符(Unicode代码点)是否为标题字符。字符是否为标题字符,如果它的一般类别类型,通过提供
getType(codePoint),是TITLECASE_LETTER。有些字符看起来像一对拉丁字母。 例如,有一个大写字母,看起来像“LJ”,并有一个相应的小写字母,看起来像“lj”。 第三种形式,看起来像“Lj”,是使用初始大写以小写形式呈现单词时使用的适当形式,如书名。
这些是此方法返回
true一些Unicode字符:-
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON -
LATIN CAPITAL LETTER L WITH SMALL LETTER J -
LATIN CAPITAL LETTER N WITH SMALL LETTER J -
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
许多其他Unicode字符也是标题。
- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果角色是标题; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isLowerCase(int),isUpperCase(int),toTitleCase(int),getType(int)
-
-
isDigit
public static boolean isDigit(char ch)
确定指定的字符是否为数字。甲字符是数字,如果它的一般类别类型,通过提供
Character.getType(ch),是DECIMAL_DIGIT_NUMBER。一些包含数字的Unicode字符范围:
-
'\u0030'到'\u0039',ISO-LATIN-1位数('0'到'9') -
'\u0660'到'\u0669',阿拉伯语 - 印度数字 -
'\u06F0'到'\u06F9',扩展的阿拉伯语 - 印度数字 -
'\u0966'到'\u096F',梵文数字 -
'\uFF10'至'\uFF19','\uFF19'数字
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isDigit(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
true如果字符是数字; 否则为false。 - 另请参见:
-
digit(char, int),forDigit(int, int),getType(char)
-
-
isDigit
public static boolean isDigit(int codePoint)
确定指定的字符(Unicode代码点)是否为数字。甲字符是数字,如果它的一般类别类型,通过提供
getType(codePoint),是DECIMAL_DIGIT_NUMBER。一些包含数字的Unicode字符范围:
-
'\u0030'到'\u0039',ISO-LATIN-1位数('0'到'9') -
'\u0660'到'\u0669',阿拉伯语 - 印度数字 -
'\u06F0'到'\u06F9',扩展的阿拉伯语 - 印度数字 -
'\u0966'到'\u096F',梵文数字 -
'\uFF10'到'\uFF19',全角数字
- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果字符是数字; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
forDigit(int, int),getType(int)
-
-
isDefined
public static boolean isDefined(char ch)
确定是否在Unicode中定义了字符。如果至少满足下列条件之一,则定义字符:
- 它在UnicodeData文件中有一个条目。
- 它具有UnicodeData文件定义的范围中的值。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isDefined(int)方法。- 参数
-
ch- 要测试的角色 - 结果
-
true如果字符在Unicode中具有已定义的含义; 否则为false。 - 从以下版本开始:
- 1.0.2
- 另请参见:
-
isDigit(char),isLetter(char),isLetterOrDigit(char),isLowerCase(char),isTitleCase(char),isUpperCase(char)
-
isDefined
public static boolean isDefined(int codePoint)
确定是否在Unicode中定义了字符(Unicode代码点)。如果至少满足下列条件之一,则定义字符:
- 它在UnicodeData文件中有一个条目。
- 它具有UnicodeData文件定义的范围中的值。
- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果字符在Unicode中具有已定义的含义; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isDigit(int),isLetter(int),isLetterOrDigit(int),isLowerCase(int),isTitleCase(int),isUpperCase(int)
-
isLetter
public static boolean isLetter(char ch)
确定指定的字符是否为字母。如果字符的一般类别类型(由
Character.getType(ch)提供)是以下任何一种字符,则该字符被视为字母:-
UPPERCASE_LETTER -
LOWERCASE_LETTER -
TITLECASE_LETTER -
MODIFIER_LETTER -
OTHER_LETTER
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isLetter(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
true如果角色是一个字母;false否则。 - 另请参见:
-
isDigit(char),isJavaIdentifierStart(char),isJavaLetter(char),isJavaLetterOrDigit(char),isLetterOrDigit(char),isLowerCase(char),isTitleCase(char),isUnicodeIdentifierStart(char),isUpperCase(char)
-
-
isLetter
public static boolean isLetter(int codePoint)
确定指定的字符(Unicode代码点)是否为字母。如果字符的一般类别类型(由
getType(codePoint)提供)是以下任何一种字符,则该字符被视为字母:-
UPPERCASE_LETTER -
LOWERCASE_LETTER -
TITLECASE_LETTER -
MODIFIER_LETTER -
OTHER_LETTER
- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果角色是一个字母; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isDigit(int),isJavaIdentifierStart(int),isLetterOrDigit(int),isLowerCase(int),isTitleCase(int),isUnicodeIdentifierStart(int),isUpperCase(int)
-
-
isLetterOrDigit
public static boolean isLetterOrDigit(char ch)
确定指定的字符是字母还是数字。一个字符被认为是如果任何一个字母或数字
Character.isLetter(char ch)或Character.isDigit(char ch)回报true的字符。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isLetterOrDigit(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
true如果字符是字母或数字; 否则为false。 - 从以下版本开始:
- 1.0.2
- 另请参见:
-
isDigit(char),isJavaIdentifierPart(char),isJavaLetter(char),isJavaLetterOrDigit(char),isLetter(char),isUnicodeIdentifierPart(char)
-
isLetterOrDigit
public static boolean isLetterOrDigit(int codePoint)
确定指定的字符(Unicode代码点)是字母还是数字。一个字符被认为是如果任何一个字母或数字
isLetter(codePoint)个或isDigit(codePoint)回报true的字符。- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果字符是字母或数字; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isDigit(int),isJavaIdentifierPart(int),isLetter(int),isUnicodeIdentifierPart(int)
-
isJavaLetter
@Deprecated(since="1.1") public static boolean isJavaLetter(char ch)
Deprecated.Replaced by isJavaIdentifierStart(char).确定指定的字符是否允许作为Java标识符中的第一个字符。当且仅当满足下列条件之一时,字符才可以启动Java标识符:
-
isLetter(ch)返回true -
getType(ch)返回LETTER_NUMBER -
ch是货币符号(例如'$') -
ch是连接标点字符(例如'_')。
- 参数
-
ch- 要测试的角色。 - 结果
-
true如果字符可以启动Java标识符; 否则为false。 - 从以下版本开始:
- 1.0.2
- 另请参见:
-
isJavaLetterOrDigit(char),isJavaIdentifierStart(char),isJavaIdentifierPart(char),isLetter(char),isLetterOrDigit(char),isUnicodeIdentifierStart(char)
-
-
isJavaLetterOrDigit
@Deprecated(since="1.1") public static boolean isJavaLetterOrDigit(char ch)
Deprecated.Replaced by isJavaIdentifierPart(char).确定指定的字符是否可能是Java标识符的一部分,而不是第一个字符。当且仅当满足以下任何条件时,字符可能是Java标识符的一部分:
- 这是一封信
- 它是货币符号(例如
'$') - 它是一个连接标点字符(如
'_') - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 它是一个组合标记
- 它是一个非间距标记
-
isIdentifierIgnorable为该字符返回true。
- 参数
-
ch- 要测试的角色。 - 结果
-
true如果该字符可能是Java标识符的一部分; 否则为false。 - 从以下版本开始:
- 1.0.2
- 另请参见:
-
isJavaLetter(char),isJavaIdentifierStart(char),isJavaIdentifierPart(char),isLetter(char),isLetterOrDigit(char),isUnicodeIdentifierPart(char),isIdentifierIgnorable(char)
-
isAlphabetic
public static boolean isAlphabetic(int codePoint)
确定指定的字符(Unicode代码点)是否为字母。如果字符的一般类别类型(由
getType(codePoint)提供)是以下任何一种,则该字符被视为字母字符:-
UPPERCASE_LETTER -
LOWERCASE_LETTER -
TITLECASE_LETTER -
MODIFIER_LETTER -
OTHER_LETTER -
LETTER_NUMBER
- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果字符是Unicode字母字符,false。 - 从以下版本开始:
- 1.7
-
-
isIdeographic
public static boolean isIdeographic(int codePoint)
确定指定的字符(Unicode代码点)是否为Unicode标准定义的CJKV(中文,日文,韩文和越南文)表意文字。- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果字符是Unicode表意文字字符,false。 - 从以下版本开始:
- 1.7
-
isJavaIdentifierStart
public static boolean isJavaIdentifierStart(char ch)
确定指定的字符是否允许作为Java标识符中的第一个字符。当且仅当满足下列条件之一时,字符才可以启动Java标识符:
-
isLetter(ch)返回true -
getType(ch)返回LETTER_NUMBER -
ch是货币符号(例如'$') -
ch是连接标点字符(例如'_')。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isJavaIdentifierStart(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
true如果字符可以启动Java标识符; 否则为false。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isJavaIdentifierPart(char),isLetter(char),isUnicodeIdentifierStart(char),SourceVersion.isIdentifier(CharSequence)
-
-
isJavaIdentifierStart
public static boolean isJavaIdentifierStart(int codePoint)
确定字符(Unicode代码点)是否允许作为Java标识符中的第一个字符。当且仅当满足下列条件之一时,字符才可以启动Java标识符:
-
isLetter(codePoint)返回true -
getType(codePoint)返回LETTER_NUMBER - 引用的字符是货币符号(例如
'$') - 引用的字符是连接标点字符(例如
'_')。
- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果字符可以启动Java标识符; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isJavaIdentifierPart(int),isLetter(int),isUnicodeIdentifierStart(int),SourceVersion.isIdentifier(CharSequence)
-
-
isJavaIdentifierPart
public static boolean isJavaIdentifierPart(char ch)
确定指定的字符是否可能是Java标识符的一部分,而不是第一个字符。如果满足以下任何条件,则字符可能是Java标识符的一部分:
- 这是一封信
- 它是货币符号(例如
'$') - 它是一个连接标点字符(如
'_') - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 它是一个组合标记
- 它是一个非间距标记
-
isIdentifierIgnorable回报true的字符
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isJavaIdentifierPart(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
true如果该字符可能是Java标识符的一部分; 否则为false。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isIdentifierIgnorable(char),isJavaIdentifierStart(char),isLetterOrDigit(char),isUnicodeIdentifierPart(char),SourceVersion.isIdentifier(CharSequence)
-
isJavaIdentifierPart
public static boolean isJavaIdentifierPart(int codePoint)
确定字符(Unicode代码点)是否可能是Java标识符的一部分,而不是第一个字符。如果满足以下任何条件,则字符可能是Java标识符的一部分:
- 这是一封信
- 它是货币符号(例如
'$') - 它是一个连接标点字符(如
'_') - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 它是一个组合标记
- 它是一个非间距标记
-
isIdentifierIgnorable(codePoint)个回报true的字符
- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果字符可能是Java标识符的一部分; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isIdentifierIgnorable(int),isJavaIdentifierStart(int),isLetterOrDigit(int),isUnicodeIdentifierPart(int),SourceVersion.isIdentifier(CharSequence)
-
isUnicodeIdentifierStart
public static boolean isUnicodeIdentifierStart(char ch)
确定指定的字符是否允许作为Unicode标识符中的第一个字符。当且仅当满足下列条件之一时,字符才可以启动Unicode标识符:
-
isLetter(ch)返回true -
getType(ch)返回LETTER_NUMBER。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isUnicodeIdentifierStart(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
true如果字符可能启动Unicode标识符; 否则为false。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isJavaIdentifierStart(char),isLetter(char),isUnicodeIdentifierPart(char)
-
-
isUnicodeIdentifierStart
public static boolean isUnicodeIdentifierStart(int codePoint)
确定是否允许指定的字符(Unicode代码点)作为Unicode标识符中的第一个字符。当且仅当满足下列条件之一时,字符才可以启动Unicode标识符:
-
isLetter(codePoint)返回true -
getType(codePoint)返回LETTER_NUMBER。
- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果字符可能启动Unicode标识符; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isJavaIdentifierStart(int),isLetter(int),isUnicodeIdentifierPart(int)
-
-
isUnicodeIdentifierPart
public static boolean isUnicodeIdentifierPart(char ch)
确定指定的字符是否可能是Unicode标识符的一部分,而不是第一个字符。当且仅当以下陈述之一为真时,字符可能是Unicode标识符的一部分:
- 这是一封信
- 它是一个连接标点字符(如
'_') - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 它是一个组合标记
- 它是一个非间距标记
-
isIdentifierIgnorable返回true这个字符。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isUnicodeIdentifierPart(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
true如果字符可能是Unicode标识符的一部分; 否则为false。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isIdentifierIgnorable(char),isJavaIdentifierPart(char),isLetterOrDigit(char),isUnicodeIdentifierStart(char)
-
isUnicodeIdentifierPart
public static boolean isUnicodeIdentifierPart(int codePoint)
确定指定的字符(Unicode代码点)是否可能是Unicode标识符的一部分,而不是第一个字符。当且仅当以下陈述之一为真时,字符可能是Unicode标识符的一部分:
- 这是一封信
- 它是一个连接标点字符(如
'_') - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 它是一个组合标记
- 它是一个非间距标记
-
isIdentifierIgnorable为此字符返回true。
- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果字符可能是Unicode标识符的一部分; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isIdentifierIgnorable(int),isJavaIdentifierPart(int),isLetterOrDigit(int),isUnicodeIdentifierStart(int)
-
isIdentifierIgnorable
public static boolean isIdentifierIgnorable(char ch)
确定指定的字符是否应被视为Java标识符或Unicode标识符中的可忽略字符。Java标识符或Unicode标识符中可以忽略以下Unicode字符:
- ISO控制字符不是空格
-
'\u0000'至'\u0008' -
'\u000E'至'\u001B' -
'\u007F'至'\u009F'
-
- 具有
FORMAT常规类别值的所有字符
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isIdentifierIgnorable(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
true如果字符是可忽略的控制字符,可能是Java或Unicode标识符的一部分; 否则为false。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isJavaIdentifierPart(char),isUnicodeIdentifierPart(char)
- ISO控制字符不是空格
-
isIdentifierIgnorable
public static boolean isIdentifierIgnorable(int codePoint)
确定指定的字符(Unicode代码点)是否应被视为Java标识符或Unicode标识符中的可忽略字符。Java标识符或Unicode标识符中可以忽略以下Unicode字符:
- ISO控制字符不是空格
-
'\u0000'至'\u0008' -
'\u000E'至'\u001B' -
'\u007F'至'\u009F'
-
- 具有
FORMAT常规类别值的所有字符
- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果字符是可忽略的控制字符,可能是Java或Unicode标识符的一部分; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isJavaIdentifierPart(int),isUnicodeIdentifierPart(int)
- ISO控制字符不是空格
-
toLowerCase
public static char toLowerCase(char ch)
使用UnicodeData文件中的大小写映射信息将字符参数转换为小写。请注意,对于某些字符范围,
Character.isLowerCase(Character.toLowerCase(ch))并不总是返回true,特别是那些符号或表意符号。通常,应使用
String.toLowerCase()将字符映射为小写。String案例映射方法比Character案例映射方法有几个好处。String案例映射方法可以执行区域设置敏感的映射,上下文相关的映射和1:M字符映射,而Character案例映射方法则不能。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
toLowerCase(int)方法。- 参数
-
ch- 要转换的字符。 - 结果
- 字符的小写等价物,如果有的话; 否则,角色本身。
- 另请参见:
-
isLowerCase(char),String.toLowerCase()
-
toLowerCase
public static int toLowerCase(int codePoint)
使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为小写。请注意,对于某些字符范围,
Character.isLowerCase(Character.toLowerCase(codePoint))并不总是返回true,特别是那些符号或表意符号。通常,应使用
String.toLowerCase()将字符映射为小写。String案例映射方法比Character案例映射方法有几个好处。String案例映射方法可以执行区域设置敏感的映射,上下文相关的映射和1:M字符映射,而Character案例映射方法则不能。- 参数
-
codePoint- 要转换的字符(Unicode代码点)。 - 结果
- 字符的小写等效项(Unicode代码点),如果有的话; 否则,角色本身。
- 从以下版本开始:
- 1.5
- 另请参见:
-
isLowerCase(int),String.toLowerCase()
-
toUpperCase
public static char toUpperCase(char ch)
使用UnicodeData文件中的大小写映射信息将字符参数转换为大写。请注意,对于某些字符范围,
Character.isUpperCase(Character.toUpperCase(ch))并不总是返回true,特别是那些符号或表意符号。通常,应使用
String.toUpperCase()将字符映射为大写。String案例映射方法比Character案例映射方法有几个好处。String案例映射方法可以执行区域设置敏感的映射,上下文相关的映射和1:M字符映射,而Character案例映射方法则不能。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
toUpperCase(int)方法。- 参数
-
ch- 要转换的字符。 - 结果
- 字符的大写等价物,如果有的话; 否则,角色本身。
- 另请参见:
-
isUpperCase(char),String.toUpperCase()
-
toUpperCase
public static int toUpperCase(int codePoint)
使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为大写。请注意,对于某些字符范围,
Character.isUpperCase(Character.toUpperCase(codePoint))并不总是返回true,特别是那些符号或表意符号。通常,应使用
String.toUpperCase()将字符映射为大写。String案例映射方法比Character案例映射方法有几个好处。String案例映射方法可以执行区域设置敏感的映射,上下文相关的映射和1:M字符映射,而Character案例映射方法则不能。- 参数
-
codePoint- 要转换的字符(Unicode代码点)。 - 结果
- 字符的大写等价物,如果有的话; 否则,角色本身。
- 从以下版本开始:
- 1.5
- 另请参见:
-
isUpperCase(int),String.toUpperCase()
-
toTitleCase
public static char toTitleCase(char ch)
使用UnicodeData文件中的大小写映射信息将字符参数转换为标题。 如果一个字符没有明确的标题映射,并且根据UnicodeData本身不是一个标题字符串,那么大写映射将作为等效的标题映射返回。 如果char参数已经是标题char,则将返回相同的char值。请注意,对于某些字符范围,
Character.isTitleCase(Character.toTitleCase(ch))并不总是返回true。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
toTitleCase(int)方法。- 参数
-
ch- 要转换的字符。 - 结果
- 相当于该字符的标题词,如果有的话; 否则,角色本身。
- 从以下版本开始:
- 1.0.2
- 另请参见:
-
isTitleCase(char),toLowerCase(char),toUpperCase(char)
-
toTitleCase
public static int toTitleCase(int codePoint)
使用UnicodeData文件中的案例映射信息将字符(Unicode代码点)参数转换为titlecase。 如果一个字符没有明确的标题映射,并且根据UnicodeData本身不是一个标题字符串,那么大写映射将作为等效的标题映射返回。 如果字符参数已经是标题字符,则将返回相同的字符值。请注意,对于某些字符范围,
Character.isTitleCase(Character.toTitleCase(codePoint))并不总是返回true。- 参数
-
codePoint- 要转换的字符(Unicode代码点)。 - 结果
- 相当于该字符的标题词,如果有的话; 否则,角色本身。
- 从以下版本开始:
- 1.5
- 另请参见:
-
isTitleCase(int),toLowerCase(int),toUpperCase(int)
-
digit
public static int digit(char ch, int radix)返回指定基数中字符ch的数值。如果基数不在范围
MIN_RADIX≤radix≤MAX_RADIX或者价值ch不是指定基数的有效数字,-1返回。 如果至少满足下列条件之一,则字符是有效数字:- 方法
isDigit是字符的true,并且字符的Unicode十进制数值(或其单字符分解)小于指定的基数。 在这种情况下,返回十进制数值。 - 该字符是大写拉丁字母
'A'至'Z',其代码小于radix + 'A' - 10。 在这种情况下,返回ch - 'A' + 10。 - 该字符是小写拉丁字母
'a'到'z',其代码小于radix + 'a' - 10。 在这种情况下,返回ch - 'a' + 10。 - 该字符是全
'\uFF21'写拉丁字母A('\uFF21')到Z('\uFF3A')之一,其代码小于radix + '\uFF21' - 10。 在这种情况下,返回ch - '\uFF21' + 10。 - 该字符是全宽小写拉丁字母a(
'\uFF41')到z('\uFF5A')之一,其代码小于radix + '\uFF41' - 10。 在这种情况下,返回ch - '\uFF41' + 10。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
digit(int, int)方法。- 参数
-
ch- 要转换的字符。 -
radix- 基数。 - 结果
- 指定基数中字符表示的数值。
- 另请参见:
-
forDigit(int, int),isDigit(char)
- 方法
-
digit
public static int digit(int codePoint, int radix)返回指定基数中指定字符(Unicode代码点)的数值。如果基数不在范围
MIN_RADIX≤radix≤MAX_RADIX,或者如果字符不是指定基数的有效数字,-1返回。 如果至少满足下列条件之一,则字符是有效数字:- 方法
isDigit(codePoint)是字符的true,并且字符的Unicode十进制数值(或其单字符分解)小于指定的基数。 在这种情况下,返回十进制数值。 - 该字符是大写拉丁字母
'A'至'Z',其代码小于radix + 'A' - 10。 在这种情况下,返回codePoint - 'A' + 10。 - 该字符是小写拉丁字母
'a'至'z',其代码小于radix + 'a' - 10。 在这种情况下,返回codePoint - 'a' + 10。 - 该字符是全
'\uFF21'写拉丁字母A('\uFF21')到Z('\uFF3A')之一,其代码小于radix + '\uFF21' - 10。 在这种情况下,返回codePoint - '\uFF21' + 10。 - 该字符是全宽小写拉丁字母a(
'\uFF41')到z('\uFF5A')之一,其代码小于radix + '\uFF41'- 10。 在这种情况下,返回codePoint - '\uFF41' + 10。
- 参数
-
codePoint- 要转换的字符(Unicode代码点)。 -
radix- 基数。 - 结果
- 指定基数中字符表示的数值。
- 从以下版本开始:
- 1.5
- 另请参见:
-
forDigit(int, int),isDigit(int)
- 方法
-
getNumericValue
public static int getNumericValue(char ch)
返回指定的Unicode字符表示的int值。 例如,字符'\u216C'(罗马数字50)将返回值为50的int。大写字母AZ(
'\u0041'到'\u005A'),小写字母('\u0061'到'\u007A')和全宽变体('\uFF21'到'\uFF3A'和'\uFF41'到'\uFF5A')形式的数值从10到35'\uFF5A'。这与Unicode规范无关,不会为这些char值分配数值。如果字符没有数字值,则返回-1。 如果字符的数值不能表示为非负整数(例如,小数值),则返回-2。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
getNumericValue(int)方法。- 参数
-
ch- 要转换的字符。 - 结果
-
字符的数值,作为非负
int值; -2如果字符具有数值但该值不能表示为非负int值; 如果字符没有数字值,则返回-1。 - 从以下版本开始:
- 1.1
- 另请参见:
-
forDigit(int, int),isDigit(char)
-
getNumericValue
public static int getNumericValue(int codePoint)
返回指定字符(Unicode代码点)表示的int值。 例如,字符'\u216C'(罗马数字50)将返回值为50的int。在他们的大写(字母AZ
'\u0041'通过'\u005A'),小写('\u0061'通过'\u007A'()和全宽变体'\uFF21'通过'\uFF3A'和'\uFF41'通过'\uFF5A')形式具有10到35的数值这是独立于Unicode规范,其中的不会为这些char值分配数值。如果字符没有数字值,则返回-1。 如果字符的数值不能表示为非负整数(例如,小数值),则返回-2。
- 参数
-
codePoint- 要转换的字符(Unicode代码点)。 - 结果
-
字符的数值,作为非负
int值; -2如果字符具有数字值但该值不能表示为非负int值; 如果字符没有数字值,则返回-1。 - 从以下版本开始:
- 1.5
- 另请参见:
-
forDigit(int, int),isDigit(int)
-
isSpace
@Deprecated(since="1.1") public static boolean isSpace(char ch)
Deprecated.Replaced by isWhitespace(char).确定指定的字符是否为ISO-LATIN-1空格。 此方法仅返回以下五个字符的true: truechars Character Code Name'\t'U+0009HORIZONTAL TABULATION'\n'U+000ANEW LINE'\f'U+000CFORM FEED'\r'U+000DCARRIAGE RETURN' 'U+0020SPACE- 参数
-
ch- 要测试的角色。 - 结果
-
true如果字符是ISO-LATIN-1空格; 否则为false。 - 另请参见:
-
isSpaceChar(char),isWhitespace(char)
-
isSpaceChar
public static boolean isSpaceChar(char ch)
确定指定的字符是否为Unicode空格字符。 当且仅当Unicode标准将字符指定为空格字符时,才将字符视为空格字符。 如果角色的常规类别类型是以下任何一种,则此方法返回true:-
SPACE_SEPARATOR -
LINE_SEPARATOR -
PARAGRAPH_SEPARATOR
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isSpaceChar(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
true如果角色是空格字符; 否则为false。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isWhitespace(char)
-
-
isSpaceChar
public static boolean isSpaceChar(int codePoint)
确定指定的字符(Unicode代码点)是否为Unicode空格字符。 当且仅当Unicode标准将字符指定为空格字符时,才将字符视为空格字符。 如果角色的常规类别类型是以下任何一种,则此方法返回true:- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果角色是空格字符; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isWhitespace(int)
-
isWhitespace
public static boolean isWhitespace(char ch)
根据Java确定指定的字符是否为空格。 当且仅当它满足以下条件之一时,字符才是Java空白字符:- 它是Unicode空格字符(
SPACE_SEPARATOR,LINE_SEPARATOR,或PARAGRAPH_SEPARATOR),但不也是非打破空间('\u00A0','\u2007','\u202F')。 - 它是
'\t',U + 0009 HORIZONTAL'\t'。 - 它是
'\n',U + 000A LINE FEED。 - 它是
'\u000B',U + 000B VERTICAL'\u000B'。 - 它是
'\f',U + 000C FORM FEED。 - 它是
'\r',U + 000D'\r'RETURN。 - 它是
'\u001C',U + 001C FILE SEPARATOR。 - 它是
'\u001D',U + 001D GROUP SEPARATOR。 - 它是
'\u001E',U + 001E RECORD SEPARATOR。 - 它是
'\u001F',U + 001F UNIT SEPARATOR。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isWhitespace(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
true如果字符是Java空白字符; 否则为false。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isSpaceChar(char)
- 它是Unicode空格字符(
-
isWhitespace
public static boolean isWhitespace(int codePoint)
根据Java确定指定的字符(Unicode代码点)是否为空白。 当且仅当它满足以下条件之一时,字符才是Java空白字符:- 它是Unicode空格字符(
SPACE_SEPARATOR,LINE_SEPARATOR,或PARAGRAPH_SEPARATOR),但不也是非打破空间('\u00A0','\u2007','\u202F')。 - 它是
'\t',U + 0009 HORIZONTAL'\t'。 - 它是
'\n',U + 000A LINE FEED。 - 它是
'\u000B',U + 000B VERTICAL'\u000B'。 - 它是
'\f',U + 000C FORM FEED。 - 这是
'\r',U + 000D'\r'RETURN。 - 它是
'\u001C',U + 001C FILE SEPARATOR。 - 它是
'\u001D',U + 001D GROUP SEPARATOR。 - 它是
'\u001E',U + 001E RECORD SEPARATOR。 - 它是
'\u001F',U + 001F UNIT SEPARATOR。
- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果字符是Java空白字符; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isSpaceChar(int)
- 它是Unicode空格字符(
-
isISOControl
public static boolean isISOControl(char ch)
确定指定的字符是否为ISO控制字符。 一个字符被认为如果其代码是在范围为ISO控制字符'\u0000'通过'\u001F'或在范围'\u007F'通过'\u009F'。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isISOControl(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
true如果字符是ISO控制字符; 否则为false。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isSpaceChar(char),isWhitespace(char)
-
isISOControl
public static boolean isISOControl(int codePoint)
确定引用的字符(Unicode代码点)是否为ISO控制字符。 一个字符被认为如果其代码是在范围为ISO控制字符'\u0000'通过'\u001F'或在范围'\u007F'通过'\u009F'。- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果角色是ISO控制角色; 否则为false。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isSpaceChar(int),isWhitespace(int)
-
getType
public static int getType(char ch)
返回表示字符常规类别的值。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
getType(int)方法。- 参数
-
ch- 要测试的角色。 - 结果
-
类型为
int的值,表示字符的常规类别。 - 从以下版本开始:
- 1.1
- 另请参见:
-
COMBINING_SPACING_MARK,CONNECTOR_PUNCTUATION,CONTROL,CURRENCY_SYMBOL,DASH_PUNCTUATION,DECIMAL_DIGIT_NUMBER,ENCLOSING_MARK,END_PUNCTUATION,FINAL_QUOTE_PUNCTUATION,FORMAT,INITIAL_QUOTE_PUNCTUATION,LETTER_NUMBER,LINE_SEPARATOR,LOWERCASE_LETTER,MATH_SYMBOL,MODIFIER_LETTER,MODIFIER_SYMBOL,NON_SPACING_MARK,OTHER_LETTER,OTHER_NUMBER,OTHER_PUNCTUATION,OTHER_SYMBOL,PARAGRAPH_SEPARATOR,PRIVATE_USE,SPACE_SEPARATOR,START_PUNCTUATION,SURROGATE,TITLECASE_LETTER,UNASSIGNED,UPPERCASE_LETTER
-
getType
public static int getType(int codePoint)
返回表示字符常规类别的值。- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
类型为
int的值,表示角色的常规类别。 - 从以下版本开始:
- 1.5
- 另请参见:
-
COMBINING_SPACING_MARK,CONNECTOR_PUNCTUATION,CONTROL,CURRENCY_SYMBOL,DASH_PUNCTUATION,DECIMAL_DIGIT_NUMBER,ENCLOSING_MARK,END_PUNCTUATION,FINAL_QUOTE_PUNCTUATION,FORMAT,INITIAL_QUOTE_PUNCTUATION,LETTER_NUMBER,LINE_SEPARATOR,LOWERCASE_LETTER,MATH_SYMBOL,MODIFIER_LETTER,MODIFIER_SYMBOL,NON_SPACING_MARK,OTHER_LETTER,OTHER_NUMBER,OTHER_PUNCTUATION,OTHER_SYMBOL,PARAGRAPH_SEPARATOR,PRIVATE_USE,SPACE_SEPARATOR,START_PUNCTUATION,SURROGATE,TITLECASE_LETTER,UNASSIGNED,UPPERCASE_LETTER
-
forDigit
public static char forDigit(int digit, int radix)确定指定基数中特定数字的字符表示形式。 如果值radix不是有效基数,或者值digit不是指定基数中的有效数字,则返回空字符('\u0000')。该
radix参数是有效的,如果它是大于或等于MIN_RADIX且小于或等于MAX_RADIX。 如果0 <= digit < radix,则digit参数有效。如果该数字小于10,则返回
'0' + digit。 否则,返回值'a' + digit - 10。- 参数
-
digit- 要转换为字符的数字。 -
radix- 基数。 - 结果
-
指定基数中指定数字的
char表示形式。 - 另请参见:
-
MIN_RADIX,MAX_RADIX,digit(char, int)
-
getDirectionality
public static byte getDirectionality(char ch)
返回给定字符的Unicode方向性属性。 字符方向性用于计算文本的视觉排序。 未定义char值的方向性值为DIRECTIONALITY_UNDEFINED。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
getDirectionality(int)方法。- 参数
-
ch-char,其请求方向性属性。 - 结果
-
char值的方向性属性。 - 从以下版本开始:
- 1.4
- 另请参见:
-
DIRECTIONALITY_UNDEFINED,DIRECTIONALITY_LEFT_TO_RIGHT,DIRECTIONALITY_RIGHT_TO_LEFT,DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC,DIRECTIONALITY_EUROPEAN_NUMBER,DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR,DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR,DIRECTIONALITY_ARABIC_NUMBER,DIRECTIONALITY_COMMON_NUMBER_SEPARATOR,DIRECTIONALITY_NONSPACING_MARK,DIRECTIONALITY_BOUNDARY_NEUTRAL,DIRECTIONALITY_PARAGRAPH_SEPARATOR,DIRECTIONALITY_SEGMENT_SEPARATOR,DIRECTIONALITY_WHITESPACE,DIRECTIONALITY_OTHER_NEUTRALS,DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING,DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE,DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING,DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE,DIRECTIONALITY_POP_DIRECTIONAL_FORMAT,DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE,DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE,DIRECTIONALITY_FIRST_STRONG_ISOLATE,DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
-
getDirectionality
public static byte getDirectionality(int codePoint)
- 参数
-
codePoint- 请求方向性属性的字符(Unicode代码点)。 - 结果
- 角色的方向性。
- 从以下版本开始:
- 1.5
- 另请参见:
-
DIRECTIONALITY_UNDEFINED,DIRECTIONALITY_LEFT_TO_RIGHT,DIRECTIONALITY_RIGHT_TO_LEFT,DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC,DIRECTIONALITY_EUROPEAN_NUMBER,DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR,DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR,DIRECTIONALITY_ARABIC_NUMBER,DIRECTIONALITY_COMMON_NUMBER_SEPARATOR,DIRECTIONALITY_NONSPACING_MARK,DIRECTIONALITY_BOUNDARY_NEUTRAL,DIRECTIONALITY_PARAGRAPH_SEPARATOR,DIRECTIONALITY_SEGMENT_SEPARATOR,DIRECTIONALITY_WHITESPACE,DIRECTIONALITY_OTHER_NEUTRALS,DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING,DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE,DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING,DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE,DIRECTIONALITY_POP_DIRECTIONAL_FORMAT,DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE,DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE,DIRECTIONALITY_FIRST_STRONG_ISOLATE,DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
-
isMirrored
public static boolean isMirrored(char ch)
确定是否根据Unicode规范镜像该字符。 当以从右到左的文本显示时,镜像字符应使其字形水平镜像。 例如,'\u0028'LEFT PARENTHESIS在语义上被定义为左括号 。 这将显示为从右到左的文本中从左到右但作为“)”的文本中的“(”。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isMirrored(int)方法。- 参数
-
ch-char,请求镜像属性 - 结果
-
true如果char是镜像的,则false如果char未镜像或未定义。 - 从以下版本开始:
- 1.4
-
isMirrored
public static boolean isMirrored(int codePoint)
确定是否根据Unicode规范镜像指定的字符(Unicode代码点)。 当以从右到左的文本显示时,镜像字符应使其字形水平镜像。 例如,'\u0028'LEFT PARENTHESIS在语义上被定义为左括号 。 这将显示为从右到左的文本中从左到右但作为“)”的文本中的“(”。- 参数
-
codePoint- 要测试的字符(Unicode代码点)。 - 结果
-
true如果字符被镜像,false如果字符不是镜像的或没有定义。 - 从以下版本开始:
- 1.5
-
compareTo
public int compareTo(Character anotherCharacter)
以数字方式比较两个Character对象。- Specified by:
-
compareTo在界面Comparable<Character> - 参数
-
anotherCharacter- 要比较的Character。 - 结果
-
值
0如果参数Character等于这个Character; 的值小于0,如果这Character在数值上比少Character参数; 如果此Character在数值上大于Character参数(无符号比较),则值大于0。 请注意,这是严格的数字比较; 它不依赖于语言环境。 - 从以下版本开始:
- 1.2
-
compare
public static int compare(char x, char y)以数字方式比较两个char值。 返回的值与返回的值相同:Character.valueOf(x).compareTo(Character.valueOf(y))- 参数
-
x- 第一个char来比较 -
y- 第二个char进行比较 - 结果
-
值
0如果x == y; 小于0的值,如果x < y; 如果为0则值大于x > y - 从以下版本开始:
- 1.7
-
reverseBytes
public static char reverseBytes(char ch)
返回通过反转指定的char值中的字节顺序获得的值。- 参数
-
ch- 其中char反转字节顺序。 - 结果
-
通过反转(或等效地,交换)指定的
char值中的字节获得的值。 - 从以下版本开始:
- 1.5
-
getName
public static String getName(int codePoint)
返回指定字符codePoint的Unicode名称,如果代码点为unassigned,则返回null。注意:如果未通过UnicodeData文件(由Unicode Consortium维护的Unicode字符数据库的一部分)为指定的字符分配名称,则返回的名称与表达式的结果相同。
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);- 参数
-
codePoint- 字符(Unicode代码点) - 结果
- 指定字符的Unicode名称,如果未分配代码点,则返回null。
- 异常
-
IllegalArgumentException- 如果指定的codePoint不是有效的Unicode代码点。 - 从以下版本开始:
- 1.7
-
codePointOf
public static int codePointOf(String name)
返回给定Unicode字符名称指定的Unicode字符的代码点值。注意:如果UnicodeData文件(由Unicode Consortium维护的Unicode字符数据库的一部分)未为字符分配名称,则其名称将定义为表达式的结果
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);name匹配不区分大小写,删除了任何前导和尾随空格字符。- 参数
-
name- Unicode字符名称 - 结果
- 由其名称指定的字符的代码点值。
- 异常
-
IllegalArgumentException- 如果指定的name不是有效的Unicode字符名称。 -
NullPointerException- 如果name是null - 从以下版本开始:
- 9
-
-