Ruby中的文本處理

原創

2020-06-26 21:16

在《Ruby基礎教程》中，作者爲了詳細說明對文本的操作舉了一個非常生動的例子。我在學習的時候有一些地方不太理解，標記如下，與大家共勉。

Encoding.default_external = Encoding.find('utf-8')

pattern = Regexp.new(("(.{0,10})("+ARGV[0]+")(.{0,10})").to_s.encode('utf-8'))
filename = ARGV[1]

count = 0
File.open(filename) do |file|
file.each_line do |line|
  line.scan(pattern) do |s|
    prefix_len = 0
    s[0].each_char do |ch|
       if ch.ord < 128
         prefix_len += 1
       else
         prefix_len += 2
       end
    end
    space_len = 20 - prefix_len
    puts "#{" "*space_len}#{s[0]}<<#{s[1]}>>#{s[2]}"
    count += 1
    end
  end
end
puts "count: #{count}"

1.關於正則表達式

Ruby中定義了sub，gsub和scan三個方法來接收正則表達式，上面示例中使用了scan方法。

2.關於ch.ord方法

可以獲取字符編碼的碼位。本例中，由於碼位小於 128 時即爲 ASCII 碼，這時將長度加 1，除此以外的情況下則加 2，這些都是爲了確定空白個數 space_len 以確保 20 個字符。然後再在 s[0] 之前留出與字符數相應的空白，這樣輸出結果就整齊多了。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

服務器端編程語言報告出爐，PHP 獨佔鰲頭十幾年

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragr

2021-09-14 16:43:53

Ruby 之父：不要違背開發人員的本能

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":5},"content":[{"type":"text","text":"Grigory：Ru

2021-04-25 12:03:57

Ruby大“翻車”：代碼庫因許可證失誤被下架，致50 萬個項目陷入混亂

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-04-08 15:03:52

因許可證不兼容，50 萬+項目受到影響，Rails 替換了出問題的庫

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2021-03-31 14:13:49

水貨CTO入職不到半年犯下低級錯誤，將公司拖入無底深淵

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"blockq

2021-03-22 18:35:50

假如編程語言是《權力的遊戲》中的角色（下）

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-03-22 18:35:23

InfoQ 編程語言 2 月排行榜，更好的投票活動來了

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

InfoQ 中文站

2021-03-22 18:34:58

InfoQ 編程語言1月排行榜：邀你投票

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

InfoQ 中文站

2021-01-21 17:28:56

2021年最值得學習的10種編程語言

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

Statistics and Data

2021-01-19 14:13:58

Redwood：將Ruby on Rails開發體驗帶到JavaScript

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2020-11-21 11:03:56

40歲學編程，我最終選擇了Rust

每個程序員都有自己的“真命”編程語言。本文經原作者授權，由InfoQ翻譯併發布。儘管我早在小學的時候就電腦玩得如魚得水，似乎註定要進入 IT 行業，但後來卻經歷了屢次失敗。今年，當我步入四十不惑時，我終於學會了編程。也許我的經歷會讓你明

2020-09-30 12:38:52

十年後將要凋零的五種編程語言

隨着時間的流逝，程序員們發現了更新、更簡單的工作方式，新的編程語言如雨後春筍般出現，但只有少數編程語言能成爲社區的新寵。這種進步的一個副作用是一些古老的編程語言必然會跟歷史一樣被人們遺忘。如果一個編程語言無法隨着時間的推移提升其價值，那麼它

2020-08-31 10:18:59

Ruby on Rails的國際化，本地化問題的解決(轉載)

原文出自: http://my.donews.com/woodstudio/ Ruby on Rails是一個很不錯的web開發框架，不過由於目前其本身對國際化的支持較差，所以需要一些輔助的東西來解決國際化問題。我最先使用的是一個叫

2020-07-08 02:37:16

亂七八糟的Ruby筆記

全當爲了體會Rails的魅力,學學基礎Ruby,摘自鋤頭書,其實這本書的後半本比較精華一些輸出字符串的方法:可以使用puts與print,如果需要帶換

2020-07-06 15:14:20

[火星NetBeans6.5] 敗了敗了

NetBeans6.5都整成介樣了Ruby支持相當無敵，代碼提示粉貼心麻痹，俺要改改世界觀，俺要辭職，俺要去賣腸粉發佈時間：2008-12-12 18:12:11 | 閱讀：69 | 評論：0

2020-07-06 04:19:14

24小時熱門文章

最新文章

最新評論文章