About us データのじかんとは?
データのやり取りで頻繁に使われるCSVファイル。普段何気なく使っているもののExcelファイルとどう違うのかと疑問に思う方も少なくないのではないでしょうか。実はCSVファイルとExcelファイルでは性質やできることが異なるため、混同すると仕事に支障が出る場合もあります。
この記事ではCSVファイルとExcelファイルの違いについてわかりやすくまとめ、使い分け方法や注意点についてもご紹介します。
※2021年10月24日(月)更新しました。
CSVファイルとExcelファイルの最も大きな違いは「互換性が高いか、装飾・機能の自由度が高いか」ということです。
拡張子「.csv」のCSVファイルは互換性が高く、Excelのみならずメモ帳、メールソフト、データベースソフトなどほとんどのソフトに取り込んで閲覧、編集することが可能です。そのため、Excelファイルを扱えるかが不明な相手とデータのやり取りを行う際はCSVに変換される場合が多いです。
拡張子「.xlsx」のExcelファイルはCSVファイルと比べて互換性に劣ります。表計算ソフトでは互換性のあるものが増えており、GoogleスプレッドシートやAccess、Dr.Sumなどのデータベースソフトでも一部対応可能な製品はありますが、まだCSVの水準には至らないでしょう。その代わりに装飾・機能の自由度がCSVファイルよりはるかに高く、セルに色を付けたり表をグラフにしたり文字のフォントを指定したり関数を使って計算したりすることができます。
CSVファイルとCSVはそもそも「Comma Separated Value(=カンマ(,)で区切った値)」の頭文字をとって名付けられました。そのため、Excelで表形式で表されているデータは、CSVではカンマで区切ったシンプルなテキスト形式で表現されます。
上図は、データが同じ“売上集計表”をCVSファイル(左)とExcelファイル(右)をPCで使用したときのものになります。
CVSファイルはWindowsに標準搭載されているメモ帳で、ExcelファイルはMicrosoft 365で開いています。
前節以前でご説明したように、CSVファイルとExcelファイルの最も大きな違いは「互換性が高いか、装飾・機能の自由度が高いか」で、CSVファイルは必要最低限のシンプルなデータ構造に対し、Excelファイルはドキュメンテーション用途の機能を豊富に備えています。
以下にCVSファイルとExcelファイルの特徴を示します。
CVSファイル | Excelファイル |
・データ(値)は行単位で格納し、カンマ(,)で列に区切る。 ・メモ帳などのテキストエディターで閲覧、作成、編集が可能で、データ交換が容易 ・書式情報を含むことができない。 ・データの加工、計算、集計等はできない。 | ・データ(値)は、セル(行、列)単位で格納 ・使用できるアプリ、ソフトが限定される。 ・セル、データに書式情報(フォント、色など)を含むことができる。 ・セルに関数を入力することでデータの加工、計算、集計等が可能 |
CSVファイルはExcelファイルと違い、ファイル形式をサポートしているアプリやソフトを必要とせず、テキストエディターさえあれば、作成・編集・閲覧することができます。
Microsoft Excelで作成したファイルをCSV形式で保存する、でも作成できますが、CSVファイルの記法はそれほど難しくないため、通常はテキストエディターで作成、または閲覧することになります。
ここではCSVファイルを自身で作成、または閲覧したときに、内容が理解できるよう、「CSVファイルの記法」について紹介します。
区切り文字で区切られたデータ(列)の項目名やタイトルが記された行のことで、先頭に記載します。
上図の「日付,商品名,単価,個数,金額」に相当する部分で、各列のデータの内容を使用する側が認識していれば、特に記載の必要はありません。
その場合、先頭行からデータを記述することになります。
各行に複数記載されているデータを区切るための文字を“区切り文字”と言います。
CSVは「,」(カンマ)区切りが基本ですが、(タブ)で区切る場合もあり、両者の混同を避けるため、この場合は、TSV(Tab-Separated Values)と呼びます。
各行に複数記載されている値の終了を示します。
改行コードは使用するOSによって異なり、一般的にWindowsは<CR><LF>、UNIXは<LF>を使用します。
WindowsとUNIXでデータ交換を行う場合、どちらかの改行コードしか認識できないと、各行のデータの終了が識別できなくなるので注意が必要です。
また、改行コードは、エディターによっては表示しないものもあるので、改行コードに加え、スペースやタブが明示化されているものの使用をおすすめします。
CSVファイルで区切った値は、数値、もしくは文字列になりますが、この中に、カンマ(,)、改行(、)、ダブルクォート(”)といった「制御文字」を含む場合、以下のように値をダブルクォート(”)で囲む必要があります。
2020/8/27,商品E,400,4,“1,600“
ダブルクォート(”)に限っては、例えば『ダブルクォート(”)』を値にしたい場合(かぎカッコは除く)、
“ダブルクォート(““)“
と、二重化(”→””)することでダブルクォートは文字列として識別されます。
なお、「制御文字」を使用しない場合、値をダブルクォートで囲む必要はありません。
CSVファイルを用いることになるのは主に以下のような場合です。
Excelファイルと互換性のないデータベースソフトでは、Excelで作った表はCSVファイルに変換して読み込む必要があります。反対にデータベースソフトのデータも拡張子「.xlsx」として出力できないため、CSVファイルとして出力してExcelに読み込ませることになります。また、Excelを所有しているかわからない他社や不特定多数にデータを渡したい場合もCSVの互換性が役立ちます。装飾や機能が省かれる分データ容量が軽くなるのもポイントです。
Excelファイルを用いるべきなのは、Excelデータと互換性のあるソフトだけでデータの編集・閲覧が完結する場合です。その場合はさまざまな加工が施せるExcelデータをそのまま使う方が便利でしょう。
Excelで作成したレポートの見栄えをそのまま活用したい場合、印刷設定が重要な場合などもこれに該当します。また、正しいExcelの使い方ではない、という議論もありますが、方眼紙としてExcelを活用する場合は、Excelで開かない限りは意図した形で見ることができないため、Excelファイルとして共有し、Excelを使って開かれるべきでしょう。これは「神エクセル」もしくは「ネ申エクセル」と呼ばれ、データ活用を目的とした場合、もっとも避けるべきExcel活用法として知られています。
CSVファイルはExcelの機能の一部が保存できないため、ExcelファイルをCSV形式で保存しようすると以下の警告文が出ることもあります。
続いて、CSVファイルをExcelに取り込む際に注意すべき点と、問題を事前に回避する対処方をご紹介します。
1 2
30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!