久99视频-久99热-久99久热只有精品国产男同-久99久精品视频免费观看v-天天干天天玩-天天干天天透

txtformat文本處理軟件

下載地址

您的位置:首頁 > > 軟件下載 > 應用軟件 > 文字處理 > txtformat下載
95.56%
4.44%

txtformat文本處理軟件 v2.10中文綠色版

  • 軟件介紹
  • 軟件截圖
  • 相關下載
軟件標簽:
txtformat中文版是一款功能超多的文本處理軟件,它集合了文本批量更改,文本編碼格式轉(zhuǎn)換(方便用來更改EPUB轉(zhuǎn)換出來的txt文本的編碼格式更改),文本文件合并,文本章節(jié)統(tǒng)計等等功能,另外txtformat2.10比2.09版本的功能多了一個一鍵審核功能(也就是上面的圖4),對文本校對非常有幫助

txtformat軟件特點:

1、它帶有亂碼轉(zhuǎn)換,十二種格式轉(zhuǎn)換,比如txt轉(zhuǎn)jar、epub轉(zhuǎn)txt、pdb轉(zhuǎn)txt等,而且還帶有繁體簡體轉(zhuǎn)換功能,亂碼功能是自動查找并修復的,所以使用其他也很容易,當然此軟件的核心功能還是各種文本格式之間的轉(zhuǎn)換功能。

2、txtFormat最新版可以對文本進行合并分割及廣告刪除,是小說類文本處理的利器,支持各種文本編碼,支持批處理功能,還可以整理文本里的每個標題

txtformat軟件功能:

1、文件分割

2、文件合并

3、自動排版

4、HTML 代碼刪除

5、格式整理

6、正則表達式搜索替換

7、目錄合并

8、文本搜索替換

9、亂碼修改

10、通配符搜索替換

11、廣告刪除

12、文件更名

13、塊搜索替換

14、一鍵審核

15、文本統(tǒng)計

使用說明:


一.利用分組功能進行章節(jié)名規(guī)范化
-------------------------------
txtFormat 支持正則表達式的分組,在正則表達式中,可以用小括號來指定組。一對小括號括起來的內(nèi)容,就是一個組。
使用小括號指定一個子表達式后,匹配這個子表達式的文本(也就是此分組捕獲的內(nèi)容)可以在表達式或其它程序中作進一步的處理。默認情況下,每個分組會自動擁有一個組號,規(guī)則是:從左向右,以分組的左括號為標志,第一個出現(xiàn)的分組的組號為1,第二個為2,以此類推。
在 txtFormat 中,若要引用一個組,在一個 $ 符號后面加上想要引用組的組號。

例1
---
正則表達式 (【)([一二三四五六七八九十].{0,6})、(.*?)(】)用于捕獲象下面這樣的內(nèi)容:
【一、aaa】
【二、bbb】
【三、ccc】

在該表達式中,一共有四個分組。假定我們想把以上內(nèi)容規(guī)范化為形如以下的內(nèi)容:
 第一章 aaa
 第二章 bbb
 第三章 ccc

則可以采用替換的方法:

查找
(【)([一二三四五六七八九十].{0,6})、(.*?)(】)

并將查找的結果替換為:
 第$2章 $3


在上述替換中,引用了第二個和第三個組的結果。忽略了第一個組內(nèi)容(【)和第四個組的內(nèi)容(】)。由于第一個組和第四個組的內(nèi)容沒有引用到,所以以上替換可以簡化為:

查找
【([一二三四五六七八九十].{0,6})、(.*?)】

并將查找的結果替換為:
 第$1章 $2


二. 廣告的查找和刪除
--------------------

方法1 - 自動:
-------------
首先打開一個要想刪除廣告的小說,然后從“常用正則表達式”下拉列表中選擇“查找廣告及其它問題……”。此時,用于匹配廣告的正則表達式顯示在窗口右上方的文本框中。如果你熟悉正則表達式,可以在這里按你的需要修改此正則表達式。
然后,單擊工具條上的“廣告檢查或字符串計數(shù)”按鈕。

注意,當你點擊工具條上的“廣告檢查或字符串計數(shù)”按鈕時:
1 如果你復選了“使用正則表達式進行查找/替換”復選框,并且窗口右上方的文本框中的內(nèi)容是一個合法的正則表達式,txtFormat 將在你打開的文檔中查找匹配的串并將這些串寫入一個名為 remove.txt 的文本文件中,并用系統(tǒng)的記事本程序打開 remove.txt 供你檢查修改。
2 如果你沒有復選“使用正則表達式進行查找/替換”復選框,那么 txtFormat 將認為你要查找的是一個一般的簡單字符串。則 txtFormat 將只查找并計數(shù)你要查找的字符串在文檔中出現(xiàn)的次數(shù)。
3 如果在窗口右上方的查找和替換文本框中都沒有內(nèi)容,而你又點擊了工具條上的“廣告檢查或字符串計數(shù)”按鈕。txtFormat 將認為你是要查找文檔中的廣告內(nèi)容,它將使用默認的廣告匹配正則表來進行廣告查找。

廣告查找視你的文檔的大小及廣告內(nèi)容的多少,可能會花一些時間。當找到的廣告文本在記事本程序中打開后,請逐行仔細檢查 remove.txt 文檔中的廣告內(nèi)容。并把不是廣告的內(nèi)容刪除,在檢查時要特別小心每一行的開始和結尾處,有沒有非廣告的字符,如果有,則把這些非廣告的字符刪。
當你確信 remove.txt 文檔中的內(nèi)容全部都是廣告內(nèi)容后,保存并關閉它。然后,單擊工具欄中的“自定義替換”按鈕。txtFormat 將會把文檔中的、與 remove.txt 中的內(nèi)容相符的廣告全部刪除。

方法2 - 手動:
-------------
打開一個小說,然后從“常用正則表達式”下拉列表中選擇“查找廣告及其它問題……”。

此時,用于匹配廣告的正則表達式顯示在窗口右上方的文本框中。如果你熟悉正則表達式,可以在這里按你的需要修改此正則表達式。
然后,單擊“查找*”按鈕,光標將停留在第一個找到的內(nèi)容上,并選定找到的內(nèi)容。此時,如果你能確定找到的內(nèi)容是廣告,則單擊“替換此處”按鈕來刪除此找到的內(nèi)容。如果找到的內(nèi)容不是廣告,則單擊“查找下一個”按鈕來查找下一個廣告內(nèi)容且不刪除當前找到的內(nèi)容。
重復上述步驟,直到到到文件結束。


手動刪除廣告中的技巧
--------------------
1。
當你找到一個廣告時,你可以單擊“使用正則表達式進行查找/替換”復選框來清空“將字符串”文本框中的內(nèi)容,然后單擊“全部替換”按鈕來將文檔中所有的、與剛找到內(nèi)容匹配的內(nèi)容刪除。
然后再次從“常用正則表達式”下拉列表中選擇“查找廣告及其它問題……”,并單擊“查找下一個”繼續(xù)從當前位置開始查找(注意,不是再次從頭開始查找)。

2。如果你一次沒能處理完整個文檔,那么當你下一次打開同一文本時,光標將會停留在你上次處理到的地方,你可以接著從上次處理到的地方繼續(xù)處理(而不是從頭處理。)

3。你可以一次查找/替換多行內(nèi)容(也就是所謂的塊查找/替換)
方法:
清空“將字符串”文本框中的內(nèi)容。
選定文檔中的多行內(nèi)容(也就是你想查找的內(nèi)容)。
按 ctrl C 復制選定的多行內(nèi)容。
單擊“查找*”或“全部替換”來查找或替換你所選定的多行內(nèi)容。


三. 其它雜項技巧
----------------
很多小說中包含類似以下的信息:

16K小說網(wǎng) 更新時間:2010-3-4 13:02:57 本章字數(shù):4143

因此在處理時,先選擇"查找 更新時間…本章字數(shù)"然后“全部替換”
這樣可以在以后的處理中排除這一部分的干擾。
否則這一部分內(nèi)容也會進入到 remove.txt 中,會占相當大的內(nèi)容。
另外有些網(wǎng)站的小說會直接在章節(jié)名后面加上 " 字數(shù):????"。在此情況下,你應該從正則表達式列表中選擇"查找 字數(shù):xxxx",然后單擊“全部替換*”來清除這些字數(shù)信息。

另外,有時候,在一篇小說中,會有少部分的章節(jié)是硬回車斷行的。遇到這種情況,我建議:選定該章節(jié),然后從右鍵菜單中選擇“對選定內(nèi)容進行格式”。這樣就不用對整篇文章進行格式整理了(因為有時候這樣做太費時間了)

★★★
當文檔太大,而你不愿意花太多時間進行格式整理時,以下持巧也許會對你有幫助:
1 用正則表達式來刪除空白行。
2 用正則表達式來在章節(jié)名所在行的前后各加一個空行
3 選定整個文檔,用 tab 和 shift tab 來調(diào)整縮行(受選項設置中的“行首縮進”中設置的影響,說明如下)。


四. 選項設置中的“行首縮進”設置對文檔操作和格式整理結果的影響
--------------------------------------------------------------
    “選項設置”中的“行首縮進”選擇不但直接決定文檔最終的縮行。而且也會對用 tab 鍵和 shift tab 鍵來調(diào)節(jié)選定內(nèi)容縮行的效果發(fā)生影響。
在用 shift tab 鍵來減少縮行時,txtFormat 無論你設置的是 tab 鍵還是半角空格或是全角空格。txtFormat 都會減小一個單位的縮行(也就是說,如果你選擇的是 tab 鍵縮行,按一次 shift tab 時,txtFormat 會減少一個 tab 位的縮行。如果你選擇的是半角空格縮行,按一次 shift tab 時,txtFormat 會減少一個半角空格的縮行。同樣,如果你選擇的是全角空格縮行,按一次 shift tab 時,txtFormat 會減少一個全角空格的縮行。)
而在用 tab 鍵來增加縮行時,如果你選擇的是 tab 鍵縮行,則按一次 tab ,txtFormat 會增加一個 tab 位的縮行。余類推。


五. 格式整理都做了什么?
------------------------
txtFormat 最強大的功能之一就是“格式整理”,那么在格式整理時,txtFormat 都做了些什么呢?

在進行“格式整理”時,txtFormat 將做以下工作:

1. 除去每一行行尾的空格(包括半角,全角及制表符)。
2. 如果標記了“以句號為段落標記重新分段”,則遇句號就提行。
3. 根據(jù)用戶的設置,轉(zhuǎn)換標點符號為用戶所需要的格式(如半角轉(zhuǎn)全角,全角轉(zhuǎn)半角等)。這里面有以下幾種情況不轉(zhuǎn)換:
   a 數(shù)字間的小數(shù)點不轉(zhuǎn)換
   b 英文字符間的標點符號不轉(zhuǎn)換
   c 以下符號/-*|\c1=^@,#&[]<>及空格也不轉(zhuǎn)換
     http 后面的 : 不轉(zhuǎn)換,數(shù)字和字母后面的 ; 不轉(zhuǎn)換,數(shù)字和字母前后的 .?% 不轉(zhuǎn)換。

4. 根據(jù)用戶的設置,除去非標題行中的空格。
5. 如果行尾不是正常的行終止符,而且行的長度大于用戶設定的長度,則將此行續(xù)寫于前一行尾部(文檔中硬回車的處理)。
6. 將文檔中的 unicode 碼轉(zhuǎn)換成中文。
   什么是“文檔中的 unicode 碼”?
   在有此文檔中,有形如 #29234; #21843; #34886; #40637; 或 &#29234; &#21843; &#34886; &#40637; 這樣的內(nèi)容(前面的 & 與 # 可能是全角的)。
   這些內(nèi)容究竟是什么?你可以在 google 中搜索 &#29234; 或 &#21843; 就會明白。它們是字符,只不過表示的方法不同。我自己私下把它們稱為“文檔中的 unicode 碼”。我相信一般人遇到這樣的內(nèi)容就只能靠猜測來確定它們所代碼的內(nèi)容。而 txtFormat 在進行格式整理時,會把這些內(nèi)容自動轉(zhuǎn)達換成相對應的中文字符。此功能相當于常用正則表達式列表中的“查找 Unicode 碼”正則表達式的作用。

7. 除去文檔中可識別的廣告文本。
8. 根據(jù)用戶的設置,設定文檔的排版樣式。
9. 類似于“少*婦”、“成*人”這樣簡單的屏蔽碼的還原。
10. 類似于“sè”、“xìng”這樣的漢語拼音的還原。
11. 常見的標點符號的規(guī)范化。



六. 常用正則表達式
------------------
目前 txtFormat 提供了 30 個在文檔整理時常用正則表達式,以下順序說明它們的用途及用法。

在對常用正則表達式進行說明前,我先說一下正則表達式的一些特殊語法:

a.可有可無的匹配:
()?
? 匹配前面的子表達式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 。? 等價于 {0,1}。 

b.排除單個字符,可以用[^abc],這樣就可以排除a或者b或者c了

c.排除一個字符串,比如排除 baidu
((?!baidu)\w)+
這里使用了順序否定環(huán)視:(?!Expression),它表示所在位置右側(cè)不能匹配 Expression
其它幾種環(huán)視為:
(?<=Expression) 逆序肯定環(huán)視,表示所在位置左側(cè)能夠匹配Expression
(?<!Expression) 逆序否定環(huán)視,表示所在位置左側(cè)不能匹配Expression
(?=Expression)  順序肯定環(huán)視,表示所在位置右側(cè)能夠匹配Expression
(?!Expression)  順序否定環(huán)視,表示所在位置右側(cè)不能匹配Expression

d.多行匹配
[\S\s]*?
如果要匹配括號括起來的多行內(nèi)容:
[\((][\s\S]*?[\))]

e.重復
{n,m} 表示重復前面的內(nèi)容 n 到 m 次。

實例:匹配以ps開頭的行
基本式:ps.*?$
增強式1:(?<!g)ps.*?$        增強:不能以 g 開頭,以防止錯誤地把 gps 開頭的串也找出來
增強式2:(?<!g)ps(?!p).*?$   增強:ps后面不能跟隨 p,以防止錯誤地把 psp 開頭的串也找出來
增強式3:(?<![gGqGg])[PpрPp][SsSs](?![PpPp]).*?$  同時匹配大小寫不同,半角全角不同的ps


以下按順序?qū)ΤS谜齽t表達式列表中的正則表達式進行說明:

1.查找 廣告及其它問題……

這個正則表達式是由多個獨立的正則表達式組成的,下面分別說明:

    查找 unicode 碼(前面有該正則表達式的說明)
    (([&&])?[##][0-9]\d*[;;]|[&&](amp)?[;;][##][0-9]\d*[;;])

    查找常見屏蔽碼
    (風言\*+|十有\(zhòng)*+|(兜|繞|繞起了|繞起|轉(zhuǎn)著)\*+|盞\*+|\*+(通明|輝煌)|萬家\*+)

    查找數(shù)字間的句號
    [0-90-9]\d*[。.][0-90-9]\d*

    查找奇書網(wǎng)
    奇.{0,2}([書書]|[sSsS][HhhH][UuuU]).{0,2}[網(wǎng)網(wǎng)](.{0,2}收.{0,2}集.{0,2}整.{0,2}理|.{0,2}整.{0,2}理.{0,2}提.{0,2}供)?

    查找你下載的文件
    [您你].{0,2}下.{0,2}[載載].{0,2}的.{0,2}文.{0,2}件.*?$

    查找我看書齋\e書天空手打
    我.{0,2}看.{0,2}[書書].{0,2}齋|e書天空手打

    查找 手打 
    (手機電子書中心|wap.bookwap.net|booknet|手機風月網(wǎng)|燈火|七星閣|請支持|風語|沸騰文學會員|沸騰|沸teng|飛庫小說|飛庫網(wǎng)站|www.101.du|fei-騰|fei騰-|fei騰|feitengwenxue|fei-teng文學|fei-teng|feiteng|fei-teng-文學|fei-騰-wen-學|手.{0,2}機.{0,2}墨.{0,2}香.{0,2}書.{0,2}苑.{0,2}會.{0,2}員|墨.{0,2}香.{0,2}書.{0,2}苑.{0,2}會.{0,2}員|墨.{0,2}香.{0,2}書.{0,2}苑|飛庫|提供本章節(jié)最新|feiku|會.{0,2}員.{0,2}|94書|www.94shu.com)?(?<![只輕舉垂旗棋兇幾停拍負信甩老抬球抖下助大魔空單槍白騎箭選交旗徒起一對著打右左隨動副伸身出用擺揮雙的入殺聯(lián)失拱順收高揚搖親])手([\x20-\x7e]+)?打(更新|來源燈火書城|網(wǎng)\,提供最新文字版小說閱讀|小說bbs\.feiku\.com|小說http://飛庫論壇|小說http://|小說網(wǎng)\,提供最新手_打_版小說閱讀|,轉(zhuǎn)載請說明|轉(zhuǎn)載請說明)?(整理)?
    
    查找不得轉(zhuǎn)載
    (本書)?17k((專屬|(zhì)簽約)作品[,\,]非[常法]轉(zhuǎn)載請注明)?(首發(fā),敬請訂閱正版)?(文學網(wǎng)首發(fā))?(首發(fā),未經(jīng)授權請勿轉(zhuǎn)載)?

    查找書城
    (一.{0,2}劍.{0,2})?(一手原創(chuàng))?(手打)?[書書].{0,2}城(.{0,2}獨.{0,2}家.{0,2}首.{0,2}發(fā))?(.{0,2}會.{0,2}員.{0,2}手.{0,2}打)?(.{0,2}手.{0,2}打)?(首發(fā))?(一手手打,轉(zhuǎn)載請說明)?(3g.16k.cn希望你加入支持手打組)?(3g.16k希望你加入支持手打組)?(,手機訪問手打最快!)?(,手機訪問booknet手打最快!)?(,手機訪問http://booknet手打最快!)?(,手機訪問wap.bookwap.net手打最快!)?
    
    查找 中文網(wǎng)
    (一.{0,2}路.{0,2}看.{0,2})?(千.{0,2}載.{0,2})?(天天)?(傳盛)?中.{0,2}文.{0,2}[網(wǎng)網(wǎng)](.{0,2}小.{0,2}說.{0,2}齊.{0,2}全)?(.{0,2}首.{0,2}發(fā))?(16k)?(16k.cn)?(  \(看手打章節(jié)請到.Se\))?(  \[\.Se提供最新最快的手打章節(jié)\])?(\.101123\.Se)?(\[\.Se\]首發(fā)文字版)?
    淘太郎(第一時間)?(國慶特別)?(奉獻)?(更新)?(發(fā)布)?(首發(fā))?(外篇)?(,wap手機書站第一)?(,wap書站速度第一)?(領先所有站點手打發(fā)布)?(上傳國慶特別上傳更新)?(獨家更新)?(領先發(fā)布)?(領先更新)?(領先首發(fā))?(上傳國慶特別上傳更新)?(手打發(fā)布)?(手打更新)?(wap書站首發(fā))?(第一時間更新)?(上傳更新wap書站速度第一)?(上傳更新)?(上傳)?

    查找未完待續(xù)(前面可能有括號)
    ([\((])?未.{0,2}完.{0,2}待.{0,2}續(xù).*?$

    查找括號中的內(nèi)容
    [\(\[\{\<〈﹛〔([≤<〖](?![0-9一二三四五六七八九十她他上中下]).*?[〗>≥])〕﹜〉\>\}\]\)]+

    查找空的括號
    [\(\[\{\<〈﹛〔(【[≤<〖][〗>≥]】)〕﹜〉\>\}\]\)]+

    查找作者的話
    ^.*?新[書書].{0,40}收藏.*?$
    ^.*?收藏.{0,40}支持.*?$
    ^.*?更新時間.{1,60}本章字數(shù).+$
    ^.*?第.{1,2}[章更]到.*?$
    ^.*?(沖榜|月票|[書書]評|[書書]友).*?$
    ^.*?(推薦.{0,20}收藏|收藏.{0,20}推薦).*?$
    ^.*?求(收藏|推薦票).*?$
    ^.*?(謝謝.{0,20}打賞|打賞.{0,20}謝謝).*?$
    ^.*?歡迎.{0,20}[閱閱][讀讀].*?$
    ^.*?感謝.{0,20}[書書]友.*?$
    ^.*?還.{0,1}有一[更章].*?$
    ^.*?[^\((\{]第[一二三四五六七八九十0-90-9]{1,2}更.*?$
    ^.*?[推薦|砸|紅|黑|月]票.*?$
    ^.*?([收藏|推薦]本[書書]).*?$
    
    查找以ps開頭的行
    (?<![gGqGg])[PpрPp][SsSs](?![PpPp]).*?$

    查找點擊察看圖片鏈接
    點擊察看圖片鏈接.*?$

    查找常用廣告,這個是廣告查找的核心。
    (?![#\*/·、\.  :-a-zA-Z0-90-9A-Za-z]{20,}|.{0,3}[?。!]|[\) \? \]VIP章節(jié)目錄 )#`\-~.、:,!品支問騰入步群火直知名推版喜提留種起關供加看后本光明大去事>八吧板不布超城出打到道得的地第點定讀多發(fā)凡飛格好戶幻機家間劍接節(jié)進經(jīng)精就居開來樂理了六陸錄路們目你您齊奇輕趣圈然讓如三上時式是受書數(shù)說速同完網(wǎng)微為文紋屋武下校新星行續(xù)學迅意影由友于語月越云載在站章者正址制中注轉(zhuǎn)子字自作])([」}』Jj《》0-9a-zA-ZńЁⅹ⌒☉ξ{{} 。\(\)★…η[⑸⒌⒉⒛②③╰-′’()≮︴「∥≦≧=^^@w+$#`,㈦⑦_,∫~\[\]<>…<>℃|^、|\\ㄧ:⑴⑹.①⑥!+.·∴∵∞≈÷#@&*※§〃№〓○●△▲◎☆★◇◆□■▽▼㊣℅ˉ ̄_﹉﹊﹍﹎﹋﹌﹟﹠﹡♀♂⊕⊙↑↓←→↖↗↙↘∥∣/\∕﹨▋áǎàōóǒòēéěèīíǐìūúǔùǖǘǚǜüêɑńňɡ160A-Za-zfFΑΒΕΖΗΙΚΜΝΟΡΤΧαικνοπρστυχωАВЕИКМНОРСТУХЬабвекмнорстухъьё. -/:‘ ̄$?\?;~.|『〗あいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわを♂♀┅╔╗╚╝原名錄業(yè)進明世機阿愛八巴吧扳坂板版榜保本編不布步部藏超城持出創(chuàng)翠達打大待到道得的燈登地第點點電頂定讀瀆牘讀獨鍍多惡發(fā)凡訪飛非沸費風負閣格更供關光好何后戶戶華歡幻火或機機及紀加家間建劍薦接節(jié)盡盡進經(jīng)精敬九久就居卷爵均開看庫快來樂理連了臨麟靈零留六陸錄陸路論們擝萌盟迷免名明墨目腦你涅您爬排盤泡品七期齊奇麒起千輕清請請去趣圈全詮荃銓群然讓熱任如入三閃上十時拾世式事是適收手首受書書熟數(shù)爽說說松速鎖壇騰提同推完萬網(wǎng)網(wǎng)忘望微為未文紋蚊問汶屋吾武勿希喜下享霄小校謝新星行續(xù)軒玄學學迅雅業(yè)一議意迎影用優(yōu)幽悠滺憂優(yōu)由友于語域欲原月閱粵越閱云載載在摘站章者整正支知直址制中種豬注專轉(zhuǎn)轉(zhuǎn)子吇字自最作]{10,})(?<![!?]|[…\(,:(。xX 、武機品推種作火欲名飛多期光壇歡字去你影小久最入八或《本不出待到道得的地第電定獨格關好何后華家間接經(jīng)就卷開看來了六路目腦您排然如上十時事數(shù)松速提同完萬為屋下享星行意幽悠由友于語月越云在章整正支直制中子自劍九千三城閃手讓點微精輕翠注們就是一大的建第部正玄更出來受不知靈正十論起])(?<!完全|數(shù)千)

    查找 首發(fā)
    (本書)?(booknet)?(小說520)?(本書)?(文字版)?(=)?(\^)?(\^)?(([㈦七⑦7].{0,2}星.{0,2}閣.{0,2}))?首([\x20-\x7e]+)?[發(fā)發(fā)](小說)?(520)?(=)?(\^)?(\^)?|(\()?[㈦七⑦7].{0,2}星.{0,2}閣(.{0,2}手打)?(.{0,2}手機站:)?(,請支持正版)?(.com,請支持正版閱讀)?(.com)?(。)?(17k文學網(wǎng))?(www.17k.com,請支持正版閱讀)?(www.17k.com)?(www.ngzw.com)?(文學網(wǎng))?(一起看文學網(wǎng))?(于起點中文網(wǎng)http://cmfu.com/)?
    
    查找文學網(wǎng)
    (孔子)?(一起看)?(16k)?(吾愛)?文.{0,2}[學學].{0,2}[網(wǎng)網(wǎng)]

    查找雜項
    您的輕輕一次點擊(,溫暖我整個碼字人生,)?(本書軍史頻道首發(fā),請勿轉(zhuǎn)載)?(本書軍史頻道首發(fā),請支持正版)?(本書首發(fā),請勿轉(zhuǎn)載,支持正版)?(本書一起看軍史頻道首發(fā),請勿轉(zhuǎn)載)?(本書一起看文學網(wǎng)首發(fā),請支持正版)?(本書軍史頻道首發(fā))?(本書一起看軍事頻道首發(fā))?(本書首發(fā))?(本書一起看軍史頻道首發(fā))?(本書軍事頻道首發(fā))?(。)?

    查找手打快
    手.{0,1}打.{0,1}快

    查找手機書苑
    手.{0,1}機.{0,1}書.{0,1}苑

    查找電腦站
    電.{0,2}腦.{0,2}[站網(wǎng)]

    查找本書轉(zhuǎn)載
    本.{0,2}[書書].{0,2}[轉(zhuǎn)轉(zhuǎn)].{0,2}[載載].{0,}中.{0,2}文.{0,2}[網(wǎng)網(wǎng)]

    查找手機站
    手.{0,2}[機機].{0,2}站(zuilu)?(wap\.)?

    查找全文字
    全.{0,2}文.{0,2}字(小說閱讀,盡在)?(小說閱讀)?

    查找大家讀書院
    大.{0,2}家.{0,2}[讀讀].{0,2}[書書].{0,2}院

    查找泡書吧
    泡.{0,2}[書書].{0,2}吧(小.{0,2}[說說].{0,2}[網(wǎng)網(wǎng)]|[獨獨].{0,2}家.{0,2}首.{0,2}[發(fā)發(fā)].{0,2}文.{0,2}字)?|(中文)?[\.。.]se(首[發(fā)發(fā)])?|(首.{0,4}[發(fā)發(fā)].{0,4})?君.{0,4}子.{0,4}堂(.{0,4}首.{0,2}[發(fā)發(fā)])?

    查找八路中文
    八路中文(聯(lián)盟)?(會員)?(手打)?(上傳)?

    查找麒麟文學
    麒麟(小說|文學|70xs.com首發(fā)|.com首發(fā)|www…com|www.)

    查找幻劍書盟
    (本書為)?幻.{0,2}劍.{0,2}書.{0,2}盟(首[發(fā)發(fā)],未經(jīng)本站同意請勿轉(zhuǎn)載!掃較|掃校)?
    
    查找 一路看文學網(wǎng)
    ((一路看)|(一起看))((小說網(wǎng))|(文學網(wǎng)))

    禁書請刪除|&quot;|分.{0,2}割.{0,2}線|字數(shù)[::][0-9]\d* 

    查找獨家首發(fā)
    [獨獨].{0,2}家.{0,2}(首.{0,2}[發(fā)發(fā)])
    
    查找理想文學
    理.{0,2}想.{0,2}文.{0,2}[學學]

    查找燈火書城
    (看一手小說希望你加入.{0,2})?(更新最快)?(手[機機])?(更新最快)?[燈燈].{0,2}火.{0,2}[書書].{0,2}城([獨獨]家.{0,2}手.{0,2}打)?([獨獨]家.{0,2}首.{0,2}[發(fā)發(fā)])?(希望你登陸)?(希望登陸)?(bookwap\.net)?(希望你加入支持)?(.{0,2}手.{0,2}打)?([獨獨]家首[發(fā)發(fā)])?
    城.{0,2}[書書].{0,2}火.{0,2}燈
    
    查找飛庫
    飛.{0,1}庫(.{0,1}手.{0,1}打)?([網(wǎng)網(wǎng)])?(feiku)?(站)?(整理)?(小說)?(論壇)?(feiku)?(wap書站速度第一)?

    查找風語
    (?<![言])風(語|yu)(網(wǎng))?(首發(fā))?(小說網(wǎng))?(wap\.)?(手打更新!)?(手打整理!)?

    查找一六開
    [壹一十拾].{0,2}[六陸陸路].{0,2}[開看KkKkΚκ](.{0,2}更新快)?(,看小[說說]就來一六開)?(小說網(wǎng)手機閱讀訪問)?(文.{0,4}[學學].{0,4}[網(wǎng)網(wǎng)])?(官方)?(文學手打員手打,謝謝大家支持)? 
    [\|壹一十拾1①ㄧ1⑴l].{0,2}[六陸陸路6б6⑹⑥].{0,2}[開看KkKkΚκ](.{0,2}[xXXxχхХΧ×].{0,2}[SsSs])?(.{0,2}小.{0,2}說)?(.{0,2}[網(wǎng)站])?(整理)?(.{0,4}[cCсcCС℃].{0,4}[nNNΝnη])?(.{0,2}更.{0,2}新.{0,2}最.{0,2}快)?(16k)?(16k.cn)?(希望你加入支持)?
    
    查找更多章節(jié)
    更.{0,2}多.{0,2}章.{0,2}節(jié)|章節(jié)內(nèi)容開始
    
    查找文心閣
    文.{0,4}心.{0,4}閣.{0,4}首.{0,4}[發(fā)發(fā)]

    查找圏子網(wǎng)/圈子網(wǎng)
    (歡迎訪問)?([\.。.])?[WwWwω].{0,2}[AaAaаαà].{0,2}[PpрPp].{0,2}[圏圈].{0,2}子(.{0,2}網(wǎng).{0,2}友.{0,2}收.{0,2}集)?(.{0,2}文.{0,2}學.{0,2}收.{0,2}藏)?(.{0,2}網(wǎng))?(收藏)?

    查找 101du
    [\|1①ㄧ1⑴l].{0,2}[0O0o].{0,2}[\|1①ㄧ1⑴l].{0,2}[DdDd].{0,2}[UuUu](\.)?(。)?(net會員手打)?(手打)? 

    
    查找 由數(shù)字,字母,標點組成的行
    (?<=        |    |  |\t)([。,;:!·\#¥%※×—+,\"\'!@#$%^\&*-=‘’“”\.;:!a-zA-Zб℃āáǎàōóǒòēéěèīíǐìūúǔùǖǘǚǜü一0-90-9A-Za-zΑΒΕΖΗΙΚΛΜΝΟΡΤΧαβγδεηθικλμνοπρστυχωАБВИКЛМНОПРСТУХШЩЪЬЯабвгезиклмнопрстуфхчшщъьё]{1,})\r\n
    
    查找電腦閱讀
    電.{0,4}腦.{0,4}[閱閱].{0,4}[讀讀]
    
    查找手機閱讀
    手.{0,2}[機機].{0,2}[閱閱].{0,2}[讀讀](.{0,2}整理)?(16k)?
    
    查找云軒閣
    云.{0,4}軒.{0,4}閣

    查找 小說網(wǎng)
    (手機)?(中文)?(經(jīng)典)?小.{0,4}[說說].{0,4}[吧網(wǎng)網(wǎng)]

    查找電子書
    (天空)?電.{0,2}子.{0,2}[書書]

    查找沸騰文學
    (歡迎訪問)?((feiteng)|(fei.{0,2}騰)|(沸.{0,2}teng)|(沸.{0,2}騰))((.{0,2}文.{0,2}[學學])((收.{0,2}藏))?|(收.{0,2}藏)|(.{0,2}會.{0,2}員.{0,2}手.{0,2}打)|(.{0,2}手打))(.{0,2}手.{0,2}打.{0,2}團.{0,2}傾.{0,2}情.{0,2}奉.{0,2}獻)?(.{0,2}會.{0,2}員.{0,2}手.{0,2}打)?(.{0,2}收.{0,2}藏)?(.{0,2}101du.net收藏)?
    查找(歡迎訪問)?沸.{0,2}騰.{0,2}文.{0,2}學(.{0,2}手.{0,2}打.{0,2}團.{0,2}傾.{0,2}情.{0,2}奉.{0,2}獻)?(.{0,2}會.{0,2}員.{0,2}手.{0,2}打)?(.{0,2}收.{0,2}藏)?(.{0,2}101du.net收藏)?

    查找 .bbs
    ([\.。.])?[ΒBbBb].{0,2}[ΒBbBb].{0,2}[SsSs]
    
    本[書書].{1,9}[學學][網(wǎng)網(wǎng)]

    查找看書就來
    ([\((])?看.{0,2}[書書].{0,2}就.{0,2}來
    
    本站(web網(wǎng)站)?開通(umd,jar格式下載)?(umd,jar手機電子書下載)?(umd,jar小說下載)?(umd,jar格式小說下載)?
    
    查找 手打
    (?<![只輕舉垂旗棋兇幾停拍負信甩老抬球抖下助大魔空單槍白騎箭選交旗徒起一對著打右左隨動副伸身出用擺揮雙的入殺聯(lián)失拱順收高揚搖親])手打
    
    查找支持正版
    [支持|訂閱|購買]正版.+$

    查找友情推苊
    友情推薦|下一章|存稿|你還在看二手書嗎|投票|最新章節(jié)

    查找更新
    (手機)?更新

    查找惡靈中文
    惡.{0,2}靈.{0,2}中.{0,2}文

    查找$#@
    [$@#].{1,3}[$@#](提供)?

    查找醉露書院
    zuilu(書院)?|醉露書院|zui\*露書院|ZuiLU.Net

    查找起點
    (?<![這候白的想生一行個地濺仙便泛發(fā)能了為知立,])起點(中文)?(網(wǎng))?(首發(fā))?(.{0,2}授.{0,2}權.{0,2}[發(fā)發(fā)].{0,2}布)?

    查找不規(guī)則組合的標點符號
    [.\.。,\,、·]{2,}|…+[.\.\,、·]+|[.\.。,\,、]+…+[.\.\,、·]+

        查找百度吧
    百度.{2,7}吧.{0,7}(手打團手打)?(首.{0,2}[發(fā)發(fā)])?(手打)?

    查找墨香書苑
    (手.{0,2}[機機].{0,2})?(訪.{0,2}問.{0,2})?墨.{0,7}香.{0,2}書.{0,2}苑(.{0,2}會.{0,2}員)?(.{0,2}手.{0,2}打)?(搜集)?(整理)?
    
    查找華夏中文
    (巍.{0,2}峨.{0,2}[華華].{0,2}夏|[華華].{0,2}夏[(.{0,2}會.{0,2}員.{0,2}收.{0,2}集.{0,2}上.{0,2}傳)?(.{0,2}會.{0,2}員.{0,2}手.{0,2}打)?(.{0,2}會.{0,2}員.{0,2}打)?(.{0,2}小.{0,2}說.{0,2}網(wǎng).{0,2}收.{0,2}藏)?(.{0,2}小.{0,2}說.{0,2}網(wǎng))?(.{0,2}小.{0,2}說)?(.{0,2}中.{0,2}文.{0,2}網(wǎng).{0,2}玄.{0,2}幻.{0,2}武.{0,2}俠huaxiazw\.com)?(.{0,2}中.{0,2}文.{0,2}網(wǎng).{0,2}友.{0,2}收.{0,2}藏)?(.{0,2}中.{0,2}文.{0,2}網(wǎng).{0,2}友.{0,2}錄)?(.{0,2}中.{0,2}文.{0,2}網(wǎng).{0,2}收.{0,2}藏)?(.{0,2}中.{0,2}文.{0,2}網(wǎng))?(.{0,2}中.{0,2}文.{0,2}轉(zhuǎn).{0,2}載)?(.{0,2}中.{0,2}文)?(.{0,2}轉(zhuǎn).{0,2}載)?(.{0,2}網(wǎng))?]+)
    查找3G華夏網(wǎng)
    [33][gGqGg](華.{0,2}夏.{0,2}[網(wǎng)網(wǎng)])?    
    
    查找無敵龍
    無.{0,2}敵.{0,2}龍(.{0,2}書.{0,2}屋)?(.{0,2}手.{0,2}打)?(.{0,2}整.{0,2}理)?

    查找燈火書城
    查找(看一手小說希望你加入.{0,2})?(更新最快)?(手[機機])?燈.{0,2}火.{0,2}書.{0,2}城(bookwap\.net)?(希望你加入支持)?(.{0,2}手.{0,2}打)?([獨獨]家首[發(fā)發(fā)])?
    查找城.{0,2}書.{0,2}火.{0,2}燈

    查找風語
    風.{0,2}語.{0,2}(手.{0,2}打.{0,2})?(電腦)?小.{0,2}說(.{0,2}網(wǎng))?

    查找手打小說(網(wǎng))
    手.{0,2}打.{0,2}小.{0,2}說(.{0,2}網(wǎng))?

    查找白馬書院
    白.{0,2}馬.{0,2}書.{0,2}院
    
    查找移動書城
    移.{0,2}動.{0,2}書.{0,2}城
    
    查找云霄閣
    云.{0,2}霄.{0,2}閣(.{0,60}整理收藏)?

    查找天下書庫
    天.{0,2}下.{0,2}書.{0,2}庫

    查找萬卷書屋
    萬.{0,2}卷.{0,2}書.{0,2}屋

    查找盡在......文學網(wǎng)
    [盡盡].{0,2}在.{0,10}文.{0,2}[學學].{0,2}[網(wǎng)網(wǎng)]

    查找更新最快
    更.{0,2}新.{0,2}[超最].{0,2}快

    查找小說整理發(fā)布于
    小.{0,2}說.{0,2}整.{0,2}理(.{0,2}[發(fā)發(fā)].{0,2}布)?(.{0,2}于)?

    查找小說手機站
    小.{0,2}說.{0,2}手.{0,2}[機機].{0,2}站

    查找.net
    (97r)?([\.。.])?[NnNnη].{0,2}[EeEe].{0,2}[TtTt]

    查找.www
    ([\.。.])?[WwWwω].{0,2}[WwWwω].{0,2}[WwWwω]([\.。.])?

    查找.web
    ([\.。.])?[WwWwω].{0,2}[EeEe].{0,2}[BbBb]

    查找.cn
    ([\.。.])?[cCсcCС℃].{0,2}[nNNΝnη]

    查找.wap
    ([\.。.])?[WwWwω].{0,2}[AaAaаαà].{0,2}[PpрPp]([\.。.])?

    查找.com
    ([\.。.])?[cCсcCС℃].{0,2}[OoΟ○0ОOοoоóòōǒ0].{0,2}[mMMmМΜм]

    查找雜項
    感謝作者授權發(fā)布|共同保護作者權益|授權發(fā)布|首頁返回書目|首頁返回書頁|小說原創(chuàng)門戶|進行前后翻頁閱讀

    查找特殊字符及由其組成的串
    (&1t;|&lt;|&gt;|&qut;)|(?<![0-90-9])%|[\\/\*\^@\|\]\[^_#$&丶#@&*※§〃№〓○●△▲◎☆★◇◆□■▽▼㊣℅ˉ ̄_﹉﹊﹍﹎﹋﹌﹟﹠﹡♀♂⊕⊙↑↓←→↖↗↙↘∥∣/\∕﹨▋]+|([-\-—#…]{5,})

    查找中文間空格
    查找(?<![\n0-9a-zA-Z0-9A-Za-z  \t章節(jié)節(jié)回集卷文篇])[  \t]+(?![0-9a-zA-Z0-9A-Za-z  \t第])

    查找*號
    \*{1,80}
=======================================================================

2.查找 更新時間…本章字數(shù)  
=========================
.{0,60}更新時間.{1,40}本章字數(shù).+

很多小說中包含類似以下的信息:
XX小說網(wǎng) 更新時間:2010-3-4 13:02:57 本章字數(shù):4143
此正則表達式就是為了查找和刪除這些內(nèi)容而設置的。


3.查找 字數(shù):xxxx
================
( )?字數(shù)[::][0-90-9.]+

有些網(wǎng)站的小說會直接在章節(jié)名后面加上 " 字數(shù):????"。此正則表達式就是為了查找和刪除這些內(nèi)容而設置的。


4.查找 半角標點符號
===================
[(\x2b-\x2f|(\x21-\x29)|(\x3a-\x40)|(\x5b-\x60)|(\x7b-\x7e)]

5.查找 硬回車
=============
\n(?!.*第[一二兩三四五六七八九十○零百千0-90-9]{1,12}(章|節(jié)|節(jié)|回|集|部|卷)).*?[^]^}^※^〕^:^:^》^】^.^。^?^?^”^"^…^!^'^’^)^)^\n^!^—^〗^\-]\r\n

這個不單是查找硬回車,同時也查找以,,、“‘等符號結束的行

6.查找 數(shù)字串
=============
[0-90-9.]\d*

這個是查找由半角全角數(shù)字組成的內(nèi)容。它還有一個功能:在找到阿拉伯數(shù)字串后,會在替換欄中顯示相應的中文數(shù)字。


7.查找 字母數(shù)字串
=================
([a-zA-Záǎàōóǒòēéěèīíǐìūúǔùǖǘǚǜüêɑńňɡ0-90-9A-Za-zΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩαβγδεζηθικλμνξοπρστυφχψωАБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдежзийклмнопрстуфхцчшщъыьэюяёあいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわを])+

8.查找 字母串
=============
([a-zA-ZáǎàōóǒòēéěèīíǐìūúǔùǖǘǚǜüêɑńňɡA-Za-zΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩαβγδεζηθικλμνξοπρστυφχψωАБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдежзийклмнопрстуфхцчшщъыьэюяёあいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわを])+

9.查找 網(wǎng)絡地址
===============
[a-zA-zA-Za-zΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩαβγδεζηθικλμνξοπρστυφχψωАБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдежзийклмнопрстуфхцчшщъыьэюяёあいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわを]+://[^\s]*

10.查找 含有 ps 的行
====================
(?<![gGqGg])[PpPp][SsSs](?![PpPp]).*?$

在好多小說的章節(jié)未尾,作者會發(fā)表一些感言,說明,通知之類的與小說內(nèi)容無關的內(nèi)容,而這些內(nèi)容有時候會以 ps 開頭。
此正則表達式就是為了查找和刪除這些內(nèi)容而設置的。
該正則表達式在前面有詳細說明。

11.查找 各種括號括起來的內(nèi)容
============================
[\(\[\{\<《〈﹛〔([≤<〖].+[〗>≥])〕﹜〉》\>\}\]\)]
好多廣告或作者感言甚至手打者的感言都會出現(xiàn)在括號中


12.查找 括號括起來的內(nèi)容(包括多行)
==================================
[\((][\s\S]*?[\))]

這個是為了匹配類似于以下多行內(nèi)容的:
(推薦一本新書:
        《a new book of mine》!!!!!
        書號12345,本書簡介......      )


13.查找 【】括起來的內(nèi)容
========================
【.*?】

【】是個異類,它有時會出現(xiàn)在章節(jié)名中,所以把它單獨提出來

14.查找 章節(jié)名
==============
(?<=[  \t\n])(第)([-\-一二兩三四五六七八九十○零百千0-90-9]{1,12})([章節(jié)節(jié)回集卷部].*?\r\n)

這個會找出 第一章、第1章、第1章這樣的內(nèi)容。如果找到的是第1章或第1章,則在替換欄中會顯示出“第一章”,以方便用戶進行替換。
該正則已經(jīng)修改,它只會查找行首的或以空格(包括全角、半角、制表符)開始的章節(jié)名


15.查找 HTML 標識
=================

<.+?>
也就是<>及其括住的內(nèi)容


16.查找 日期時間
================

((((1[6-9]|[2-9]\d)\d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]\d|3[01]))|(((1[6-9]|[2-9]\d)\d{2})-(0?[13456789]|1[012])-(0?[1-9]|[12]\d|30))|(((1[6-9]|[2-9]\d)\d{2})-0?2-(0?[1-9]|1\d|2[0-8]))|(((1[6-9]|[2-9]\d)(0[48]|[2468][048]|[13579][26])|((16|[2468][048]|[3579][26])00))-0?2-29-)) (20|21|22|23|[0-1]?\d):[0-5]?\d:[0-5]?\d
好象沒什么太太意義,似乎在下一版本中應去掉?


17.查找 Unicode 碼
==================
(([&&])?[##][0-9]\d*[;;])
前面有詳細說明


18.查找 干擾符
==============

(?![ ]+)[\x01-\x09\x0b-\x0c0x0e-\xff]{8,}(?<![ \r\n])

如果象下面一樣,文檔的每一行的尾部及行間都有些亂其八糟的內(nèi)容,是不是很令人崩潰?

   <aaDW  
  羅云初哪里不知道是他心疼自己? +MZO%4  
   rz }lL)2WKFT 
  傍晚的時候,大郎他們回來了。 Xq"9TYf$ 
   v8uUv%Hkd 
  羅云初給兩人倒了兩碗涼開水,隨口問道:“大哥,情況怎么樣?” qoph#\ 
   d `?EEO 
  “媳婦,別急,先讓大哥三弟喘口氣兒嘛。” 7 oYD;li$k 
   )OlYz!#? 
  “呵呵,不要緊。我嘴笨,讓三弟說吧。”大郎笑道。 D* HK[_5 
   zb9vUxN [ 

用這個正則表達式來處理它。
注:這種東西在一般的小說中還真不多見。它主要是當你想從一些網(wǎng)站用復制粘貼來采集文檔時,采集到的內(nèi)容會有這些干擾符。


19.查找 中文間的空格
====================
(?<![\n0-9a-zA-Z0-9A-Za-z  \t章節(jié)節(jié)回集卷文篇])[  \t]+(?![0-9a-zA-Z0-9A-Za-z  \t第])

有個書友說 txtFormat 未能找出文檔中的空格并加以刪除,可以沒有找到是是全角空格或制表符吧。
現(xiàn)在用這個來處理吧。注意,它只查找中文間的半角空格、全角空格和制表符。標準格式的標題中的空格也可以識別出。


20.查找 重復的章節(jié)名
====================
(正文 )?(第[-\-一二兩三四五六七八九十○零百千0-90-9]{1,12}[章節(jié)節(jié)回集卷].{0,80})\r\n.*?(\r\n.*?){0,10}([  \t]+)?\2
這個用到了分組。當你用查找或查找下一個時,如果找到在替換欄中會顯示出用于替換的章節(jié)名。如果你想一次全部替換,請在替換欄中輸入 $2 ,并按“全部替換”來替換整個檔中的所有重復的章節(jié)名,要慎用。

21.查找 引號/括號不匹配
=======================
“[^”]*\n.*?”|‘[^’]*\n.*?’|\([^\)]*\n.*?\)|([^)]*\n.*?)
在做精校書中,這樣的查找是必要的。

22.查找不規(guī)則的標點符號(新增)
[.\.。,\,、·`]{2,}|…+[.\.\,、·`]+|[.\.。,\,、`]+…+[.\.\,、·`]+
在做精校書中,這樣的查找是必要的。
它不僅僅只是查找,還會給出建議的替換內(nèi)容。

23.查找 包含指定字符(串)的行
===========================
.*?指定字符(串).*?$
這是個半自定義正則表達式,你不能直接使用它。它是用來供你按需修改而用的。
例如,你想查找包含“更新”的行。那么把該表達式中的“指定字符(串)”改為“更新”:

.*?更新.*?$


24.查找 從指定字符(串)到行尾的行
===============================
指定字符(串).*?$

半自定義正則表達式,功能同上



25.查找 以指定字符(串)開始的行
=============================
^指定字符(串).*?$

半自定義正則表達式,功能同上



26.查找 同時含有串1和串2的行
===========================
^.*串1.{0,30}串2.*?$

半自定義正則表達式,功能同上


27.從指定字符(串)開始到下一個空行的內(nèi)容
=====================================
指定字符串[\s\S]*?^[  \t]*\r\n

半自定義正則表達式,功能同上,但更強大。用于匹配章節(jié)尾的廣告。慎用。



28.將4個半角空格或兩個全角空格轉(zhuǎn)換成換行
======================================
“  |    ”
選擇后,要單擊“全部替換*”,才能生效。



29.刪除空白行
=============
^[  \t]*\r\n

選擇后,要單擊“全部替換*”,才能生效。



30.刪除空白行中的空格(空行仍保留)
=================================
[  \t]+\r\n
選擇后,要單擊“全部替換*”,才能生效。
因為有書友告訴我,格式整理后,章節(jié)名前后的空白行中有空格字符,要我想法處理。
于是有了這個表達式。


31.章節(jié)名所在行的前后各加一個空行
===============================
(^[\s\t ]{0,20}(正文[\s\t ]{0,4})?第([-\-一二兩三四五六七八九十○零百千0-90-9]{1,12})[章節(jié)節(jié)回集卷].*?$)
替換為
\r\n$1\r\n

選擇后,要單擊“全部替換*”,才能生效。
這個東西一般作為 28 項(刪除空白行)的后續(xù)處理。

32.以句號為段落標記,強制分段
(。(?:’)?(?:”)?)
替換為
$1\r\n

選擇后,要單擊“全部替換*”,才能生效。
這個與格式整理中的功能有一點區(qū)別。這個問題正則表達式在查找替換時,如果找到的是。”,就從雙引號后換行,如果找到的是。’,就從單引號后面分行。如果是純粹的句號,就從句號后面分行。


★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
★★★ 以上正則表達式每次更新時都可以改變,以更新后的最新版本為準 ★★★
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★


七. 自定義正則表達式
--------------------
在 txtFormat.exe 所在目錄,創(chuàng)建一個名為 custreg.txt 的文本文件,在其中寫入你的自定義正則表達式,格式如下:
每一個正則表達式由三行文本組成:
第一行是表達式說明,它是程序運行后顯示在“常用正則表達式”下拉列表中的內(nèi)容,用于提示用戶此表達式的用途。
第二行內(nèi)容是正則表達式內(nèi)容。
第三行是你想用來替換的內(nèi)容,如果想刪除找到的匹配內(nèi)容,則保留該空行。

一但 txtFormat.exe 所在目錄中存在著 custreg.txt 且該文件的內(nèi)容又符合要求,則該文件中所定義的正則表達式將出現(xiàn)在“常用正則表達式”列表的下方。
這樣你就可以使用這些你自定義的正則表達式了。

八. 章節(jié)檢查
有書友要求增加章節(jié)檢查功能。我想了一下,章節(jié)檢查應該就是把章節(jié)標題、章節(jié)大小全部列出,讓用戶檢查有沒有重復、缺失的章節(jié)。這個功能在“文件分割”功能中已經(jīng)有了。現(xiàn)在增強了一下,應該可以了。

九. 其它

1查找硬回車功能已經(jīng)增強,現(xiàn)在在查找硬回車時不會把章節(jié)標題也找出來了。

2添加了“查找不規(guī)則的標點符號”
[.\.。,\,、·`]{2,}|…+[.\.\,、·`]+|[.\.。,\,、`]+…+[.\.\,、·`]+
在做精校書中,這樣的查找是必要的。
它不僅僅只是查找,還會給出建議的替換內(nèi)容。
這個功能只是把它從“查找廣告及其它問題”中分離出來,并作了適當?shù)脑鰪姟?br />  
3 在“章節(jié)整理”中添加了“規(guī)范化章節(jié)標題”功能,它可以把 第032章,第032章,第零三二章這樣的章節(jié)名轉(zhuǎn)換成 第三十二章。
4 在“章節(jié)整理”中的章節(jié)名稱列表框添加了“順序”列,用于顯示該章節(jié)的順序。如果在該順序號后面有三個問號,你就應該小心檢查一下上下的章節(jié)是否有問題了(短章,重復的章,章節(jié)名稱不規(guī)范等)。
5 在“章節(jié)整理”中添加了“刪除選定章節(jié)”功能,用于刪除重復的章節(jié)(注意:是連重復的章節(jié)名及章節(jié)內(nèi)容一起刪除,請慎用)。
 

自定義正則合集功能介紹


1、引號引住的多行硬回車的處理(使用前提:排除缺字缺標點的情況下)

以《都市少帥》為例:
【雙行】
  “那你們以
  前躲在哪里?”
【三行】
  楚天給自己倒了杯紅酒,輕輕搖晃喝下兩口,淡淡道:“江湖
  事自然以江湖方式解決,你們打傷我四個兄弟,加上這三個金陵廢
  物,如果沈會長真有誠意的話,那就斬下七根手指,我保證今天的
  事就此一筆勾銷!”
【四行】
  凡間點點頭。揮手讓人把指令發(fā)出去,隨即試探著問:“少帥
  。唐大龍留著始終是個禍害,這次唐門攻打杭村冒出那么多余孽分
  子接應,就可以看出他的根深蒂固,要不咱們把他干掉絕了余孽分
  子的希望?”
【五行】
  楚天點點頭:“像今天這種情況,應該采用‘機動靈活’方針。

    能打則打,不能打則退,有戰(zhàn)機時,狠狠地打他一下,但是,必須讓各位將領明白,保存兵力不是目的,而是為了有效地消滅敵人。

    這樣做,各作戰(zhàn)部隊就可以充分揮他們作戰(zhàn)的主動性和機動性。”


●處理方法●
引號引住的多行硬回車的處理(雙行):
(“[^”“\n]{0,})[^”。!?…]\n(?:[  \t]+)?([^”“\n]{0,}”)
替換為$1$2
引號引住的多行硬回車的處理(三行):
(“[^”“\n]{0,})[^”。!?…]\n(?:[  \t]+)?([^”“\n]{0,})[^”。!?…]\n(?:[  \t]+)?([^”“\n]{0,}”)
替換為$1$2$3
引號引住的多行硬回車的處理(四行):
(“[^”“\n]{0,})[^”。!?…]\n(?:[  \t]+)?([^”“\n]{0,})[^”。!?…]\n(?:[  \t]+)?([^”“\n]{0,})[^”。!?…]\n(?:[  \t]+)?([^”“\n]{0,}”)
替換為$1$2$3$4
引號引住的多行硬回車的處理(五行):
(“[^”“\n]{0,})[^”。!?…]\n(?:[  \t]+)?([^”“\n]{0,})[^”。!?…]\n(?:[  \t]+)?([^”“\n]{0,})[^”。!?…]\n(?:[  \t]+)?([^”“\n]{0,})[^”。!?…]\n(?:[  \t]+)?([^”“\n]{0,}”)
替換為$1$2$3$4$5


2、非引號引住的硬回車處理(使用前提:排除缺字缺標點的情況下)

以《都市少帥》為例:
【雙行的】
  周兆森知道行蹤已經(jīng)被發(fā)現(xiàn),警察很快就會
  追查過來,楚天他們很快也會追殺而來,周兆森現(xiàn)在才發(fā)覺,京城雖大,卻沒有自己的藏身之地。
【三行的】
  依舊是在昨晚的豪華廂房。依舊是山珍海味和美酒,但坐在酒
  席中間的人卻不同了,李大雕父子,張榮貴以及楚天,望著楚天波
  瀾不驚的神情,李大雕知道自己玩不過人家了,于是輕輕嘆息,仰頭喝下半杯酒。
【四行的】
  楚天離開之后并沒有直接回云水山居,而是讓帥軍兄弟取道去
  龍泉山莊,在道上混了那么久,跟各種人都打過交道,唯獨沒有跟
  軍火分子有什么來往。自己也沒有想到,他們會成為自己的間接殺
  手。
【五行的】
  他緩緩低下頭,一把兩寸寬的匕首刺在胸口處,他順著滴血的
  匕首,抬起頭想要看向它的主人。卻沒有見到任何人,唐門領隊直挺挺的跪在地上。身子還是在抽撓,眼睛張得大大的,隨即又聽撲
  撲的槍響。他身后的手下正被人槍擊,每顆子彈都要了他們的命,有兩個
  家伙剛抬槍尋找目標,太陽穴就被槍口陰森森的頂著,這兩人明智
  的舉起手來。想要有活命的機會,但他們想錯了,撲撲兩聲。子彈從腦門穿過。


●處理方法●
(?<=\n)(?!.*第[壹貳叁肆伍陸柒捌玖一二兩三四五六七八九十○零百千O0-90-9]{1,12}(?:章|節(jié)|節(jié)|回|集|部|卷|篇))(.*?[^]^}^※^〕^:^:^》^】^.^。^?^?^”^"^…^!^'^’^)^)^\n^!^—^〗^\-^─])(\r\n)(?:[  \t]+)?(.*?)\r\n
替換為$1$3

或者
(?<=\n)(?!.*第[壹貳叁肆伍陸柒捌玖一二兩三四五六七八九十○零百千O0-90-9]{1,12}(?:章|節(jié)|節(jié)|回|集|部|卷|篇))(.*?[^]^}^※^〕^:^:^》^】^.^。^?^?^”^"^…^!^'^’^)^)^\n^!^—^〗^\-^─])(?:\r\n)(?:[  \t]+)?(.*?)\r\n
替換為$1$2


3、章節(jié)缺少‘章’字
『示例』
  第二百五十三 見到學姐
  ……
  第四百零八 擊殺天狼
  ……

●處理方法●
(第[-\-壹貳叁肆伍陸柒捌玖一二兩三四五六七八九十○零百千O0-90-9]{1,12}) (?!章)(.*?)\r\n
替換為$1章 $2\r\n


4、章節(jié)缺少‘第’字
『示例』
  一千零一十二章 敵人狡猾
  ……
  一千零一十三章 殺伐
  ……

●處理方法●
(?<=[  \t\n])(?<!第)([-\-壹貳叁肆伍陸柒捌玖一二兩三四五六七八九十○零百千O0-90-9]{1,12}章.*?)\r\n
替換為第$1


5、查找章節(jié)標題的.號并去除
『示例』
  第1807章 大.殺四方
  第.1808章 再展雄風
  第1.817章 最后之戰(zhàn)
  ……
  第1895章 山.雨欲來
  第1895章 山雨.欲來
  第1895章 山雨欲.來
  ……

●處理方法●
(第)(?:\.)?([0-9]+)(?:\.)?([0-9]+)(?:\.)?(章)(?: )?(?:\.)?([\x4e00-\x9fa5]+)(?:\.)?
替換為$1$2$3$4$5


6、不規(guī)則重復章節(jié)
『示例』
  第一百五十二章 掃場子
  第一百五十二章掃場子
  ……
  第963章 兇狠淘汰
  第963章兇狠淘汰
  ……
  第六百三十章 又見烈翌
  第六百三十章
  ……
  第803章  開始行動(上)
  第803章  
  ……
  第1711章 風云變色
  第1711章風云變色(4更求花)
  ……

●處理方法●
(第[-\-壹貳叁肆伍陸柒捌玖一二兩三四五六七八九十○零百千O0-90-9]{1,12}[章節(jié)節(jié)回集卷部篇])( )?(.{0,80})\r\n.*?(\r\n.*?){0,5}([  \t]+)?\1.*?\r\n
替換為$1$2$3\r\n


7、提取章節(jié)前后行
『示例』
  此月第16更砸到,鮮花至240朵,謝謝兄弟們的支持!HOho
  第1663章 敗敵
  連續(xù)兩更,繼續(xù)求花。
……
●檢查章節(jié)前后行的廣告是否清除干凈,是否缺行、缺段。
先刪除所有空白行,在搜索框輸入.+\n.*第[0-9]章*.+\n.+,然后點擊‘廣告檢查及字符串計數(shù)’就能提取出來了。


8、引號單獨一行
『示例』
  林大炮哈哈笑了起來爽朗的說:“
  少帥真是人中之龍虎幫創(chuàng)立至今少帥是唯一有膽量有身手帶著棺材進入華都別墅還能面不改色的跟林某談笑風生真實佩服。”
●處理方法●
:“\r\n[  \t]+
替換為:“


9、連續(xù)句號
『示例』
  歐陽采薇望著離去的楚天等人。眼里閃爍著殺機。但很快就恢復了平靜。今晚雖然讓楚天逃脫圍殺。但不代表他還有機會躲過所以擊殺。想到這里。歐陽采薇也領著刺下的四名高手消失在長街。唯有空氣中彌留些許的幽香。
……

●處理方法●
([\x4e00-\x9fa5]+)。([\x4e00-\x9fa5]+。.*\n)
替換為$1,$2


10、同行重復章節(jié)
([0-9]{1,12}章).*?\1.*?\r\n
○如:234章 XXX 234章 OOO


11、添加頁碼
『示例』
  第1章 轉(zhuǎn)世重生
  第2章 新的環(huán)境
  第3章 初戰(zhàn)實力
  第4章 老古董
  第5章 出名
  ……

○這個是我制作E書用的,在章節(jié)行后添加按順序排列的頁碼。
(第)([壹貳叁肆伍陸柒捌玖一二兩三四五六七八九十○〇零百千O0-90-9]{1,12})(章)(.*?\r\n)
替換為$1$2$3$4- $2 -\r\n

12、提取建議行、的得地行
.*建議:.*
○這個是我提取黑馬校對的勘誤文本用的。


13、行尾右引號前缺少嘆號
『示例』
  轉(zhuǎn)身向傭人吩咐道:“吳媽。備飯”
  ……
●處理方法●
([\x4e00-\x9fa5])”\r\n
替換為$1!”

14、查找超過5行的段落。
.{339,}\n

15、查找重復行
(.{4,}\n)\1

16、冒號后面的雙引號
(:)\r\n(?:[  \t]+)?(“)
替換為$1$2

17、冒號后添加“
:(?!“)
替換為:“

 

txtformat文本處理軟件 v2.10中文綠色版

普通下載地址:
本地普通下載
本地電信下載
浙江移動下載
北京聯(lián)通下載

精選軟件

主站蜘蛛池模板: 欧美午夜免费观看福利片 | 亚洲欧美在线观看一区二区 | 青青草国产精品 | 日本一道本中文字幕 | 日本高清视频在线www色下载 | 宅男噜噜噜66网站久久 | 一二三四影视在线看片 | 亚洲福利国产 | 亚洲欧美视频在线播放 | 情欲天堂 | 天天搞天天色 | 欧美一区二区三区久久久人妖 | 欧美在线观看黄色 | 日韩精品特黄毛片免费看 | 手机看片91精品一区 | 四虎成人精品免费影院 | 青青草国产 | 中文字幕女教师julia视频 | 视频在线免费观看网址 | 亚洲视频成人 | 亚洲精品乱码国产精品乱码 | 亚洲成a人片在线观看中文app | 亚洲va久久久噜噜噜久久 | 日产精品一二三四区国产 | 欧美一级美片在线观看免费 | 欧美特一级 | 在线观看精品视频一区二区 | 青青操影院 | 日本亚欧乱色视频在线观看 | 欧美在线播放一区二区 | 中文字幕色婷婷在线视频 | 亚洲综合一| 亚洲免费视频网站 | 青草草在线 | 天天干天天碰 | 天天狠天天透 | 香蕉视频在线观看男女 | 三级韩国一区久久二区综合 | 亚洲成综合人影院在院播放 | 日本高清在线一区二区三区 | 天天干夜夜操美女 |