設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Excel 分列處理復(fù)雜數(shù)據(jù)技巧分享

秋葉Excel 2023/2/6 12:54:05 責(zé)編:夢(mèng)澤

原文標(biāo)題:《天天都在用的 Excel 分列,還藏著這個(gè)你不知道的神技?!》

大家好,我是農(nóng)夫,專治疑難雜「數(shù)」的農(nóng)夫~

昨天同事突然扔給了我這樣一個(gè)數(shù)據(jù)~

讓我把它分成下面這樣的四列~

這還能難倒我這數(shù)據(jù)小能手嗎?

廢話不多說,盤它~

拿到這樣的數(shù)據(jù),大部分小伙伴腦袋里面率先想到的肯定是 Excel 的【分列】功能。

但是,實(shí)際操作發(fā)現(xiàn),無(wú)論是使用【分隔符號(hào)】還是【固定寬度】都無(wú)能為力呀!

于是~

咳咳!說回正題,在正式處理這個(gè)數(shù)據(jù)之前,我們先來(lái)分析下當(dāng)前數(shù)據(jù)有什么特征。

數(shù)據(jù)分析

我們觀察一下數(shù)據(jù),發(fā)現(xiàn)有以下幾個(gè)特征:

首先,第一列紅色列全都是數(shù)字,第二列藍(lán)色列全都是文字。

Excel 中的分列功能需要一個(gè)標(biāo)識(shí)符,比如空格。

那么,我們只要把數(shù)字和文字中間,插入一個(gè)標(biāo)識(shí)符就可以分列了嘛!

其次,第二列藍(lán)色列和第三列紅色列和前面的特征一樣,只不過是文字和數(shù)字換了位置;

最后,我們來(lái)看第三列紅色列和第四列綠色列。我們發(fā)現(xiàn)兩列都是數(shù)字。

但是,仔細(xì)分析就會(huì)發(fā)現(xiàn)第四列 —— 綠色列都存在一個(gè)小數(shù)點(diǎn),而小數(shù)點(diǎn)前面都是一位數(shù)字。

這樣,我們不就可以,將小數(shù)點(diǎn)加前面的一位數(shù)字進(jìn)行特征識(shí)別了嗎?

好了,既然思路都有了,那么,接下來(lái)我們要怎么做呢?

數(shù)據(jù)處理

對(duì)于數(shù)據(jù)處理,我們可以使用 Word 通配符來(lái)幫忙。

比如:你要檢索「農(nóng)」字開頭的單詞,寫入【農(nóng) [一-龜]{1,}】,就可以匹配到農(nóng)夫、農(nóng)夫好帥、農(nóng)民、農(nóng)村、農(nóng)業(yè)、農(nóng)業(yè)經(jīng)濟(jì)、農(nóng)村合作社、農(nóng)田;

而如果寫入【農(nóng) *】,只會(huì)搜到農(nóng)字這個(gè)單字。

這其實(shí)就是利用正則表達(dá)式實(shí)現(xiàn)的。

然而,正則表達(dá)式又是啥?

就相當(dāng)于通配符的升華。

通俗理解是文本數(shù)據(jù)的超級(jí)匹配模式,用更簡(jiǎn)潔的方法來(lái)指定所需的文本。類似于一對(duì)多模式。

其中,一就是由元字符組成的通用模式;多則是文本中符合該模式的文本數(shù)據(jù)。

就好比:水果(你寫的正則表達(dá)式)包括蘋果、梨、香蕉、車?yán)遄?、柚子……(匹配上的文本?shù)據(jù)。

既然是處理文本數(shù)據(jù),那我們就不能僅局限在 Excel 了,畢竟 Office 三劍客都各有各的看家本領(lǐng)。

其中,Word 在文本領(lǐng)域可是三劍客中的扛把子呀!

Word 數(shù)據(jù)處理

① 先將數(shù)據(jù)粘貼進(jìn)入 Word 中,操作過程中選擇「選擇性粘貼」-【只保留文本】。

② 序號(hào)與部門之間添加分隔符。

按【Ctrl+H】快捷鍵進(jìn)入替換頁(yè)面,在查找內(nèi)容輸入:【([0-9])([一-龜])】。

【([0-9])】:

選中 0 到 9 的任意一個(gè)數(shù)字,并定為一組。

【([一-龜])】:

選中文檔中的任意一個(gè)漢字,并定為一組。

【([0-9])([一-龜])】:

只有前面是數(shù)字,后面是漢字才能被選中,同時(shí)將其分為前后兩組~

在替換內(nèi)容中輸入:【\1|\2】

【\1】代表第一組 [0-9] 模式中查找到的任意一個(gè)數(shù)字;【\2】代表第二組 [一-龜] 模式中查找到的任意一個(gè)文字;并在兩組數(shù)據(jù)間加入分隔符【|】。

之后,點(diǎn)擊【更多 >>】,然后勾選【使用通配符】,否則,會(huì)查找失敗~

因?yàn)橥ㄅ浞俏谋局抵?strong>代替未知字符的特殊字符,可以方便查找基于特定模式匹配的數(shù)據(jù)。

以【*?】為例,勾選了通配符,會(huì)讓 Word 認(rèn)識(shí)到【*?】不再是普通字符,而是一種特殊匹配符號(hào)。

動(dòng)圖走一波~

③ 部門與工作量之間添加分隔符。

按【Ctrl+F】快捷鍵進(jìn)入替換頁(yè)面,在查找內(nèi)容輸入:【([一-龜])([0-9])】。

【([一-龜])】:

選中文檔中的任意一個(gè)漢字,并定為一組。

【([0-9])】:

選中 0 到 9 的任意一個(gè)數(shù)字,并定為一組。

【([一-龜])([0-9])】:

只有前面是漢字,后面是數(shù)字才能被選中,同時(shí)將其分為前后兩組~

在替換內(nèi)容中輸入:【\1|\2】

【\1】代表第一組 [一-龜] 模式中查到的任意一個(gè)文字,

【\2】代表第二組 [0-9] 模式中查到的任意一個(gè)數(shù)字,

并在兩組數(shù)據(jù)間加入分隔符【|】。

④ 工作量與工作周期之間添加分隔符。

按【Ctrl+F】快捷鍵進(jìn)入替換頁(yè)面,在查找內(nèi)容輸入:【([0-9])([0-9])(.)】。

【([0-9])】:

選中 0 到 9 的任意一個(gè)數(shù)字,并定為一組。

【(.)】:

選中符號(hào)【.】,并定為一組。

【([0-9])([0-9])(.)】:

只有第一個(gè)是數(shù)字,第二個(gè)數(shù)字,第三個(gè)是點(diǎn)號(hào)才能被選中,同時(shí)將其分為前中后三組~

在替換內(nèi)容中輸入:【\1|\2\3】

【\1】代表第一組【[0-9]】模式中查到的任意一個(gè)數(shù)字;

【\2】代表第二組【[0-9]】模式中查到的任意一個(gè)數(shù)字;

【\3】代表第三組中的點(diǎn)號(hào),并在第一和第二組間加入分隔符【|】。

以上設(shè)置好后,就可將數(shù)據(jù)粘回 Excel 中處理了~

Excel 數(shù)據(jù)處理

⑤ 用 Excel 進(jìn)行分列。

分隔符添加完畢后,就可以輕松的使用【分列】功能進(jìn)行數(shù)據(jù)分列了~

再用【分列】的【固定寬度】處理下列名就可以了~

最后我們就得到了這樣的規(guī)范數(shù)據(jù)了~

知識(shí)總結(jié)

一定要牢記,拿到數(shù)據(jù)不要著急。

首先要分析數(shù)據(jù)特征;根椐數(shù)據(jù)特征使用相應(yīng)的軟件進(jìn)行初步處理。

Word+Excel 處理:

? 分析數(shù)據(jù)并粘入 Word;

? 構(gòu)建正則表達(dá)式的匹配模型,如【([一-龜])([0-9])】;

? 勾選【使用通配符】并進(jìn)行分組;

? 加入分隔標(biāo)識(shí);

? 粘回 Excel【分列】處理。

PS:通配符中的各個(gè)符號(hào)都是半角下的英文狀態(tài)哦!

其實(shí)除了以上這種處理方法之外,還有一種 PQ 法,由于篇幅有限,我這里簡(jiǎn)單講下步驟,感興趣的同學(xué)可以自己動(dòng)手試試看~

PQ 處理:

? 選中數(shù)據(jù)區(qū)域內(nèi)的任意一個(gè)單元格,點(diǎn)擊【數(shù)據(jù)選項(xiàng)卡】-「獲取數(shù)據(jù)」-「來(lái)自文件」-選擇「從文件夾」;

? 拆分列 ——【按字符數(shù)】;

? 拆分列 ——【按照從非數(shù)字到數(shù)字的轉(zhuǎn)換】;

? 拆分列 ——【按照從數(shù)字到非數(shù)字的轉(zhuǎn)換】。

本文來(lái)自微信公眾號(hào):秋葉 Excel (ID:excel100),作者:農(nóng)夫

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Excel教程,Excel學(xué)院

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知