Unicode Character "蒫" U+84AB CJK Unified Ideograph-#

Unicode Version 15.1

蒫

Summary

The unicode character "蒫" at code point U+84AB is CJK Unified Ideograph-#. It is a character in the CJK Unified Ideographs block and is part of the Han script. The character is an other letter. The UTF-8 encoding of "蒫" is 0xE8 0x92 0xAB and the UTF-16 encoding is 0x84AB.

General Properties

Code Point	U+84AB
Version Added	1.1
Name	CJK Unified Ideograph-#
Block	CJK Unified Ideographs
General Category	Other Letter
Canonical Combining Class	Not Reordered
Bidirectional Class	Left To Right

Encodings

HTML Decimal Encoding	蒫
HTML Hex Encoding	蒫
UTF-8 Encoding	0xE8 0x92 0xAB
UTF-16 Encoding	0x84AB
UTF-32 Encoding	0x000084AB
C/C++/Java Escape	\u84ab

Unicode Properties

NFC Quick Check	Yes
NFD Quick Check	Yes
NFKC Quick Check	Yes
NFKD Quick Check	Yes
Numeric Type	None
Numeric Value	NaN
Line Break	Ideographic
East Asian Width	Wide
Script	Han
Script Extensions	Han
Indic Syllabic Category	Other
ID Start	Yes
XID Start	Yes
ID Continue	Yes
XID Continue	Yes
Alphabetic	Yes
Vertical Orientation	Upright
Grapheme Base	Yes
Grapheme Cluster Break	Other
Word Break	Other
Sentence Break	OLetter
Ideographic	Yes
Unified Ideograph	Yes

Unihan Properties

kBigFive	E3B5
kCCCII	23235A
kCNS1986	2-4D3C
kCNS1992	2-4D3C
kCangjie	TTQM
kCantonese	co4
kCihaiT	1161.610
kDaeJaweon	1510.300
kFourCornerCode	4451.0
kGB5	7311
kHanYu	53269.040
kHanyuPinyin	53269.040:cuó
kIRGDaeJaweon	1510.300
kIRGHanyuDaZidian	53269.040
kIRGKangXi	1049.210
kIRG_GSource	G5-692B
kIRG_HSource	HB2-E3B5
kIRG_KPSource	KP1-6EFE
kIRG_KSource	K2-5927
kIRG_TSource	T2-4D3C
kJapanese	サザシャシ
kKangXi	1049.210
kMandarin	cuó
kMojiJoho	MJ022488
kMorohashi	31595
kPhonetic	12*
kRSUnicode	140.10
kSBGY	052.41 160.18 165.25
kTotalStrokes	12
kUnihanCore2020	HMT