掃描經驗談:書本數位化

  回想這幾年來,Google為了坐穩龍頭,很有遠見的認為要持續坐大,侵犯用戶隱私這招已經不敷使用,所以公告世人示範剽竊書籍版權;並且自始至終都不認錯也不賠款,只聲稱如果作者不爽想要錢,那就打電話給Google,他會片面以60塊美金(相當於1938塊台幣)便宜買下書籍版權;默不吭聲者就視同自願放棄著作權。既然Google這種國際企業都已經將剽竊合理化、合法化,那我們消費者是否也可以有樣學樣,一起剽竊書本為己用呢!?這邊呼籲大家不要仿效Google,不然屆時官司纏身,本身又不像Google有雄厚的資金辯護,很可能要坐牢唷!!!而且就算跟Google一樣有雄厚財力,也不見得可以全身而退;目前Google因為利用唐氏症兒童被虐影片賺錢,已經有兩名主管判刑入獄了。

  雖然透過侵權行為擴權,是很不應該的行為,但如果本身持有欲掃描的書籍,又是自用的時候,那基本上是合法、合理、合情的。想想你可以將自己的書掃到OneNote收藏;如果有小筆電或平板電腦,又可以當電子書隨身閱讀;又基於OneNote可以筆記的特性,你可以在不破壞原稿的前提下,將自己的文字加到筆記中;而且就如同傳統筆記一般,你可以在OneNote中書寫做筆記,也可以用螢光筆畫重點(當然,最好要有筆);就在這美好的想像前提下,米豆進行了掃描。事後有些感想,這邊跟大家分享。


掃描過程的動作分析
首先,這邊透過動作分析,概略將掃描的流程區分為幾個動素:

開蓋→置入文件→闔蓋→*開蓋翻頁 *REPEAT

由於書本都會有相當的厚度,導致掃描器的上蓋合不攏,所以“開蓋”和“闔蓋”的動作,基本上可以改用手(或其他物品)壓;甚至省略,這樣將會有效增進效率。或許有人擔心掃描品質會受影響,那麼就實際測試比較看看吧!如果品質夠好;也就是可以接受的話,那還是考慮看看吧~可以節省許多時間唷!如果真的很龜毛又挑剔,那就考慮看看在暗室作業吧!

SANY0001 
看吧~就說蓋不起來咩!用手壓就好了啦~懶惰的米豆連壓都沒壓說XD

在省略“開蓋”和“闔蓋”動作後剩下的動素:

置入文件→*→翻頁→ *REPEAT

由於置入文件基本上等同於翻頁,所以動素再次簡化如下:

*→翻頁→ *REPEAT

動作再分析,掃描和翻頁這兩個動素可以再細分為下:

*按下[描]按鈕→等候掃描完成→等候掃描器歸位→翻頁→對準 *REPEAT

就實際操作發現,只要掃瞄完成;也就是掃描的光消失,就可以進行翻頁動作,不用等候掃描器歸位。另外翻頁後的對準動作,其實不用太計較,因為角度的校正都可以在電腦完成。需要注意的地方是:書要盡量展開,這樣可以減輕書本中間夾縫處模糊的問題;此外,書本以外的空間要保留一些,這樣才會方便校正。

SANY0002
看到中間那根白色的棒子了嗎?不用等它跑回家,你就可以翻頁了。

經過精簡後之最後的動素如下:

*按下“”按鈕→等候掃描完成→翻頁對準→ *REPEAT


掃描程式的選擇

處理掃描的程式有好幾種,Windows本身也有內建。雖然內建的也可以用,但因為某些理由,掃描書籍會建議使用其他掃描軟體…

選擇一:使用Windows內建軟體:Windows 傳真和掃描

啟動:按下[Win]→輸入“掃描”→按[Enter]
掃描:點選視窗左上角的[新掃描]→按[Enter]

選擇二:使用第三方廠商的軟體:VueScan

設定:安裝並啟動程式→按下[高級]
掃描:點選視窗底部的[掃描] 或者 [Ctrl + N] 

很明顯的,執行掃描的動作VueScan方便許多,只要按一下就可以了。如果只是單一文件的掃描,用Windows 傳真和掃描就可以了;但如果要掃描多頁面的書籍,沒有VueScan這類程式會大大增加作業時間。那掃瞄的畫質呢?不同軟體會有差嗎?上網做了一下功課,得到的答案是:會的。掃描軟體比較有名的就屬VueScan和Silverfast。而從網站分享的照片來看,效果確實會有差,但對家庭用戶而言,畫質只要可以接受就可以了;所以,原廠掃描軟體如果畫質夠好,又可以方便的按一下掃描,那其實用原廠的就好了。

比較:掃描軟體比較 « JAZZ , Food and Byja
http://kevine.wordpress.com/2006/11/11/%E6%8E%83%E6%8F%8F%E8%BB%9F%E9%AB%94%E6%AF%94%E8%BC%83/

比較:阿男的空白筆記本: Silverfast SE 與 Konica Minolta Scan Dual IV 的初體驗
http://nick621116.blogspot.com/2007/06/silverfast-se-konica-minolta-scan-dual.html

 


最終之圖像的校正
由於掃描出來的圖像往往不正,所以還要透過軟體校正。米豆推薦使用Windows Live 影像中心。主要有三大理由:
  1. 取得方便:一般安裝MSN時,就會順便安裝影像中心,而且完全免費。
  2. 功能強大:檢視、編輯、發佈、同步樣樣行;校正所需的功能通通有。
  3. 還原複本:如果編輯後反悔,只要點一下復原就可以回到最初的相片,不需要重新進行掃描作業。

首先,為了各個頁面獨立編輯,先將所有檔案複製一份。然後從檔案總管點選要校正的圖片,然後按右鍵→開啟檔案►Windows Live 影像中心;或者也可以透過檔案總管工具列的“開啟檔案”按鈕,來選擇Windows Live 影片中心。


開啟檔案後,只要點選編輯,就會出現如右的編輯工具。

基本的工作流程是:拉直→裁剪→再拉直→再裁減;也就是僅僅使用到;要是結果真的覺得不妥,也可以按下重新來過。當然有的人會想到使用自動調整,免去人工的費力,但電腦調整的結果不見得會讓人滿意,而且預設會連同色彩也變動,是否要這樣做就見仁見智了。個人是僅做拉直和裁剪,這樣全程狀況可以自己掌控,而且色彩也不會變動。

  1. 拉直:開啟檔案後直接執行,你會發現電腦很聰明的完成了初步工作。

  2. 裁剪:由於兩邊頁面不大可能同時平整,為了品質先裁剪一頁。裁剪時要盡量將頁面納入選框中,以保存最多的資料。

  3. 再拉直:為了更正傾斜的問題,可以透過滾輪放大檢視,盡可能讓文字的行或色塊與格線水平。有些舊書刊並非全頁水平,推測可能是手工排版所致。


  4. 再裁剪:由於拉直造成的角度變化,可能會有餘邊跑出來。像下圖的左下角和右邊都可以再做裁剪。做好請按下一頁(→鍵),重複所有動作直到完成。

調整大小:一般文件掃描預設多是300dpi,因此往往得到極高畫素的圖檔。像本例中掃描得之解析度為3238 × 2456,將近八百萬畫素,檔案體積為1.9MB。由於書本掃描出的檔案數一定不少,如果每頁都1.9MB,本例總共多達164頁,那所有檔案的總體積將達311.6MB,增加空間儲存成本,網路傳輸又費時,所以最後應該要重新調整圖像大小。請在影像中心選取所有圖像檔,然後按右鍵選擇“調整大小”,你可以看到如下視窗…

影像中心的調整大小,是以長邊為基礎的,所以就掃描的書籍圖檔而言,等於是在調整高度。選擇大小的地方,至少選擇“中: 1024”;如果希望擁有更高的保真度,建議選擇“高: 1280”。本例中,最終結果為:每頁1280 × 900解析度、115.2萬像素、檔案體積總計42.8MB(13.74%)、平均每頁267.67KB。

後記:圖像轉文字
由於圖像檔的體積遠遠大於文字檔,所以多少有人會想到透過OCR將其轉為文字。但要用哪套軟體轉換呢?如果你有安裝Office 2010,恭喜你,你已經擁有圖像轉文字的工具了。只要將圖像貼到OneNote,然後按右鍵→[複製圖片的文字],這樣就可以取得圖像檔中的文字了。


上圖就是將攻略本轉為文字的結果。檔案變小、可重編輯、放大縮小又不失真。

  1. 發表留言

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 變更 )

Twitter picture

You are commenting using your Twitter account. Log Out / 變更 )

Facebook照片

You are commenting using your Facebook account. Log Out / 變更 )

Google+ photo

You are commenting using your Google+ account. Log Out / 變更 )

連結到 %s

%d 位部落客按了讚: