原文標(biāo)題:《天天都在用的 Excel 分列,還藏著這個(gè)你不知道的神技?!》
大家好,我是農(nóng)夫,專治疑難雜「數(shù)」的農(nóng)夫~
昨天同事突然扔給了我這樣一個(gè)數(shù)據(jù)~
讓我把它分成下面這樣的四列~
這還能難倒我這數(shù)據(jù)小能手嗎?
廢話不多說,盤它~
拿到這樣的數(shù)據(jù),大部分小伙伴腦袋里面率先想到的肯定是 Excel 的【分列】功能。
但是,實(shí)際操作發(fā)現(xiàn),無(wú)論是使用【分隔符號(hào)】還是【固定寬度】都無(wú)能為力呀!
于是~
咳咳!說回正題,在正式處理這個(gè)數(shù)據(jù)之前,我們先來(lái)分析下當(dāng)前數(shù)據(jù)有什么特征。
數(shù)據(jù)分析
我們觀察一下數(shù)據(jù),發(fā)現(xiàn)有以下幾個(gè)特征:
首先,第一列紅色列全都是數(shù)字,第二列藍(lán)色列全都是文字。
Excel 中的分列功能需要一個(gè)標(biāo)識(shí)符,比如空格。
那么,我們只要把數(shù)字和文字中間,插入一個(gè)標(biāo)識(shí)符就可以分列了嘛!
其次,第二列藍(lán)色列和第三列紅色列和前面的特征一樣,只不過是文字和數(shù)字換了位置;
最后,我們來(lái)看第三列紅色列和第四列綠色列。我們發(fā)現(xiàn)兩列都是數(shù)字。
但是,仔細(xì)分析就會(huì)發(fā)現(xiàn)第四列 —— 綠色列都存在一個(gè)小數(shù)點(diǎn),而小數(shù)點(diǎn)前面都是一位數(shù)字。
這樣,我們不就可以,將小數(shù)點(diǎn)加前面的一位數(shù)字進(jìn)行特征識(shí)別了嗎?
好了,既然思路都有了,那么,接下來(lái)我們要怎么做呢?
數(shù)據(jù)處理
對(duì)于數(shù)據(jù)處理,我們可以使用 Word 通配符來(lái)幫忙。
比如:你要檢索「農(nóng)」字開頭的單詞,寫入【農(nóng) [一-龜]{1,}】,就可以匹配到農(nóng)夫、農(nóng)夫好帥、農(nóng)民、農(nóng)村、農(nóng)業(yè)、農(nóng)業(yè)經(jīng)濟(jì)、農(nóng)村合作社、農(nóng)田;
而如果寫入【農(nóng) *】,只會(huì)搜到農(nóng)字這個(gè)單字。
這其實(shí)就是利用正則表達(dá)式實(shí)現(xiàn)的。
然而,正則表達(dá)式又是啥?
就相當(dāng)于通配符的升華。
通俗理解是文本數(shù)據(jù)的超級(jí)匹配模式,用更簡(jiǎn)潔的方法來(lái)指定所需的文本。類似于一對(duì)多模式。
其中,一就是由元字符組成的通用模式;多則是文本中符合該模式的文本數(shù)據(jù)。
就好比:水果(你寫的正則表達(dá)式)包括蘋果、梨、香蕉、車?yán)遄?、柚子……(匹配上的文本?shù)據(jù)。)
既然是處理文本數(shù)據(jù),那我們就不能僅局限在 Excel 了,畢竟 Office 三劍客都各有各的看家本領(lǐng)。
其中,Word 在文本領(lǐng)域可是三劍客中的扛把子呀!
? Word 數(shù)據(jù)處理
① 先將數(shù)據(jù)粘貼進(jìn)入 Word 中,操作過程中選擇「選擇性粘貼」-【只保留文本】。
② 序號(hào)與部門之間添加分隔符。
按【Ctrl+H】快捷鍵進(jìn)入替換頁(yè)面,在查找內(nèi)容輸入:【([0-9])([一-龜])】。
【([0-9])】:
選中 0 到 9 的任意一個(gè)數(shù)字,并定為一組。
【([一-龜])】:
選中文檔中的任意一個(gè)漢字,并定為一組。
【([0-9])([一-龜])】:
只有前面是數(shù)字,后面是漢字才能被選中,同時(shí)將其分為前后兩組~
在替換內(nèi)容中輸入:【\1|\2】
【\1】代表第一組 [0-9] 模式中查找到的任意一個(gè)數(shù)字;【\2】代表第二組 [一-龜] 模式中查找到的任意一個(gè)文字;并在兩組數(shù)據(jù)間加入分隔符【|】。
之后,點(diǎn)擊【更多 >>】,然后勾選【使用通配符】,否則,會(huì)查找失敗~
因?yàn)橥ㄅ浞俏谋局抵?strong>代替未知字符的特殊字符,可以方便查找基于特定模式匹配的數(shù)據(jù)。
以【*?】為例,勾選了通配符,會(huì)讓 Word 認(rèn)識(shí)到【*?】不再是普通字符,而是一種特殊匹配符號(hào)。
動(dòng)圖走一波~
③ 部門與工作量之間添加分隔符。
按【Ctrl+F】快捷鍵進(jìn)入替換頁(yè)面,在查找內(nèi)容輸入:【([一-龜])([0-9])】。
【([一-龜])】:
選中文檔中的任意一個(gè)漢字,并定為一組。
【([0-9])】:
選中 0 到 9 的任意一個(gè)數(shù)字,并定為一組。
【([一-龜])([0-9])】:
只有前面是漢字,后面是數(shù)字才能被選中,同時(shí)將其分為前后兩組~
在替換內(nèi)容中輸入:【\1|\2】
【\1】代表第一組 [一-龜] 模式中查到的任意一個(gè)文字,
【\2】代表第二組 [0-9] 模式中查到的任意一個(gè)數(shù)字,
并在兩組數(shù)據(jù)間加入分隔符【|】。
④ 工作量與工作周期之間添加分隔符。
按【Ctrl+F】快捷鍵進(jìn)入替換頁(yè)面,在查找內(nèi)容輸入:【([0-9])([0-9])(.)】。
【([0-9])】:
選中 0 到 9 的任意一個(gè)數(shù)字,并定為一組。
【(.)】:
選中符號(hào)【.】,并定為一組。
【([0-9])([0-9])(.)】:
只有第一個(gè)是數(shù)字,第二個(gè)數(shù)字,第三個(gè)是點(diǎn)號(hào)才能被選中,同時(shí)將其分為前中后三組~
在替換內(nèi)容中輸入:【\1|\2\3】
【\1】代表第一組【[0-9]】模式中查到的任意一個(gè)數(shù)字;
【\2】代表第二組【[0-9]】模式中查到的任意一個(gè)數(shù)字;
【\3】代表第三組中的點(diǎn)號(hào),并在第一和第二組間加入分隔符【|】。
以上設(shè)置好后,就可將數(shù)據(jù)粘回 Excel 中處理了~
▋Excel 數(shù)據(jù)處理
⑤ 用 Excel 進(jìn)行分列。
分隔符添加完畢后,就可以輕松的使用【分列】功能進(jìn)行數(shù)據(jù)分列了~
再用【分列】的【固定寬度】處理下列名就可以了~
最后我們就得到了這樣的規(guī)范數(shù)據(jù)了~
知識(shí)總結(jié)
一定要牢記,拿到數(shù)據(jù)不要著急。
首先要分析數(shù)據(jù)特征;根椐數(shù)據(jù)特征使用相應(yīng)的軟件進(jìn)行初步處理。
Word+Excel 處理:
? 分析數(shù)據(jù)并粘入 Word;
? 構(gòu)建正則表達(dá)式的匹配模型,如【([一-龜])([0-9])】;
? 勾選【使用通配符】并進(jìn)行分組;
? 加入分隔標(biāo)識(shí);
? 粘回 Excel【分列】處理。
PS:通配符中的各個(gè)符號(hào)都是半角下的英文狀態(tài)哦!
其實(shí)除了以上這種處理方法之外,還有一種 PQ 法,由于篇幅有限,我這里簡(jiǎn)單講下步驟,感興趣的同學(xué)可以自己動(dòng)手試試看~
PQ 處理:
? 選中數(shù)據(jù)區(qū)域內(nèi)的任意一個(gè)單元格,點(diǎn)擊【數(shù)據(jù)選項(xiàng)卡】-「獲取數(shù)據(jù)」-「來(lái)自文件」-選擇「從文件夾」;
? 拆分列 ——【按字符數(shù)】;
? 拆分列 ——【按照從非數(shù)字到數(shù)字的轉(zhuǎn)換】;
? 拆分列 ——【按照從數(shù)字到非數(shù)字的轉(zhuǎn)換】。
本文來(lái)自微信公眾號(hào):秋葉 Excel (ID:excel100),作者:農(nóng)夫
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。