bidi(雙向文字)與RTL佈局總結
BIDI
雙向文字就是一個字符串中包含了兩種文字,既包含從左到右的文字又包含從右到左的文字。
大多數文字都是從左到右的書寫習慣,比如拉丁文字(英文字母)和漢字,少數文字是從右到左的書寫方式比如阿拉伯文(ar)跟希伯來文(he)。對於需要國際化支持的web應用來說,由於閱讀習慣的不同在web頁面排版和佈局中會給開發人員帶來麻煩。這種情況多數出現在從右到左的文字中,比如字符串中出現阿拉伯文、英文字母、數字以及標點符號。本文就是我在工作中遇到該類問題的總結。
在現代計算機應用中,最常用來處理雙向文字的算法是 Unicode 雙向算法(Unicode Bidirectional Algorithm),在後面的文章中我們將 Unicode 雙向算法簡稱爲 bidi 算法。
我們的web產品中使用的字符都屬於unicode字符,而unicode字符的方向屬性總共包含三類:強字符、中性字符、弱字符。
強字符的方向屬性是確定的,與上下文的bidi屬性無關,而且強字符在bidi算法中可能會對其前後的中性字符產生影響。大部分的字符都屬於強字符,比如拉丁字符、漢字、阿拉伯字符。
中性字符的方向性並不確定,受其上下文的bidi屬性影響(前後的強字符)。比如大部分的標點符號(“-”,“[]”,"()"等)跟空格。
弱字符的方向性是確定的,但不會對其上下文的bidi屬性產生影響。比如數字以及跟數字相關的符號。
一個區域內有總體方向,決定從這個區域的哪邊開始書寫文字,通常稱爲基礎方向。瀏覽器會根據你的默認語言來設置默認的基礎方向,如英語、漢語的基礎方向爲從左到右,阿拉伯語的基礎方向爲從右到左。
方向串是指在一段文字中具有相同方向性的連續字符,並且其前後沒有相同方向性的其它方向串。
下方假設大寫字母爲從右到左的文字。
<p dir="ltr">The apple is called <bdo dir="rtl">APPLE</bdo> in ar.</p>
在這個例子中,包含了三個方向串。該句子以從左到右的方向串開始,然後是從右到左的方向串,最後以從左到右的方向串結尾。
要注意的是,方向串的排列順序和數目往往會受到全局方向的影響。上面的例子中採用是從左到右的全局方向,如果該全局方向變爲從右到左,那這個例句中方向串的排列順序將如下圖所示:
<p dir="rtl">The apple is called <bdo dir="rtl">APPLE</bdo> in ar.</p>
Web中控制文字方向的方式有三種:html實體(‎ ‏)、bid與bdo標籤+dir屬性、css屬性(direction + unicode-bidi)
‎與‏可以用來打斷方向串的連續性,影響中性字符的方向
下面這段文本中共有四個中性字符:"."、 "+"、 "("、")";受從左到右基礎方向影響這幾個字符的方向性都表現爲從左到右,界面也是正常的。
<p dir="ltr">My first paragraph.U+202(C)</p>
如果將基礎方向設置爲從右到左
<p dir="rtl">My first paragraph.U+202(C)</p>
最右邊的")"受基礎方向影響會出現我們不想要的結果,而其他三個中性字符受上下文方向性影響依舊保持從左到右的方向性。
我們可以使用‎實體來改變")"的方向性。
<p dir="rtl">My first paragraph.U+202(C)‎</p>
在上文介紹方向串時已經看到大寫字母變成從右到左的方向這就是bdo元素+dir的作用,覆蓋元素內文本的方向性。
bdi元素的目的是設置一個隔離區域。如果不設置dir則使用上下文的基礎方向。
<ul> <li>Username Bill:80 points</li> <li>Username <bdi><bdo dir="rtl">Steve</bdo></bdi>: 78 points</li> </ul>
大家可以試試把bdi元素去掉是什麼效果,試着分析一下里面的方向串。
如果設置dir屬性那麼就爲這個隔離區域設置了一個基礎方向。
<p dir="rtl">These fruits <bdi dir="ltr">are called <bdo dir="rtl">APPLE</bdo>, </bdi><bdo dir="rtl">PEAR</bdo> and <bdo dir="rtl">ORANGE</bdo> in Arabic.</p>
注意裏面的空格跟標點符號的方向性。
direction跟unicode-bidi這兩個是css屬性,通常放在一起來控制文本的方向,大家可以自己查看一下css手冊。
direction+unicode-bidi:embed 的效果類似於bdi元素; direction+ unicode-bidi: bidi-override 的效果類似於bdo元素。
實際項目中我遇到阿拉伯語下在表格中顯示負數問題,看起來的效果是:“88-”;使用以上屬性direction:ltr,unicode-bidi:embed,可以改變顯示效果:“-88”。
RTL佈局
工作中遇到的另一個跟語言相關的問題就是頁面佈局問題。阿拉伯文(ar)跟希伯來文(he)的頁面佈局同英語下的頁面佈局剛好是鏡像關係。這一點大家可以試試把瀏覽器的語言設置爲阿拉伯語,觀察一下瀏覽器上的控件佈局(要保證你能再設置回來)。
首先判斷用戶設置的語言,如果是ar跟he則將全局基礎方向設置爲rtl,這時基本可以解決大多數問題。
然後將float和text-align以及控制間距的margin、padding從所有的css class中抽離出來單獨成類,如:
在RTL時將他們左右互換
LRM(\u200F)/RLM(\u200E)