標準C++文字列

前節で学んだ文字配列はC++の中の重要な部分である．文字配列はデータの編集に効率のよい道具を提供してくれる．ただ，この効率の良さは，ナル文字を用いていることによる動作誤差というリスクを背負っている．

そこで，C++には標準C++ストリング(standard C++ strings)とよばれ，文字配列に代わる動作誤差の少ないものがある．文字列の長さを文字列の中に含ませることにより，ナル文字に頼る必要を無くしたものである．

C++での入力はistreamオブジェクトcinを通り，出力はostreamオブジェクトcoutを通る．istreamクラスはcinのようなオブジェクトの行動を定義する．最も顕著な行動は抽出演算子(extraction operator)（または入力演算子） $>>$

の使い方であろう．抽出演算子はistreamオブジェクトから文字を抽出し，それらの文字に対応する値をオブジェクトに複写する．入力された文字から対応する値を形成するこの過程をフォーマットという．

例題 9..1 抽出演算子
コード
int n;
cin $>>$

n;
が入力
□□□□46
をどのように処理しているか説明せよ．

解答入力された数字46は実際は７つの文字' ' , ' ' , ' ' ,' ' ,'4' , '6' ,' $\yen$ n'を含んでいる．つまり４つの空白と数字4，6そして改行文字である．これは下の図のように考えることができる．

ストリームオブジェクトcinは一度にひとつずつ文字をスキャンする．もし，最初にスキャンした文字が余白文字(whitespace)(空白文字, タブ, 改行文字, etc)ならばそれを取り込み，無視する．そして，次の文字のスキャンを始める．この取り込んで無視するという作業を余白文字以外をスキャンするまで繰り返す．cin $>>$

nは整数型を持っているので，オブジェクトcinは整数型を探す．つまり，余白文字を全て取り除いたら，'+', '-', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9'の12文字のどれかをスキャンすることを待っている．もしこれ以外の244文字の中のどれかに出会うと，その文字をストリームに残してスキャンをストップする．この例題の場合，'4'をスキャンし取り込み，次も整数が出ることを期待している．次の'6'をスキャンし取り込み，その次に数字以外をスキャンすると，スキャンした文字を残しストップする．よって，この場合，cinは４つの空白，'4', '6'の6文字を抽出し，空白は除去し，'4'と'6'をくっつけて整数値46を作る．そして，その値をオブジェクトnにコピーする．この抽出がすんだ後，改行文字' $\yen$ n'はまだ入力ストリームに残されていて，次の入力が別の書式付入力ならば，空白文字と同様に改行文字は無視される．

抽出演算子

は入力ストリームを通るデータをフォーマットする．つまり，ストリームから文字を抽出し，それを用いて2つ目の演算子と同じ型の値にする．この過程で，空白文字はすべて無視される．この結果，抽出演算子を用いて空白文字を読むことはできない．よって，空白文字を読まなければならない場合は，cinメンバ関数の１つであるcin.get( )のようなフォーマットされない入力関数を用いる必要がある．

例題 9..2 抽出演算子を用いた反復の制御
次のプログラムを実行し，
３４　４５　５６
と入力すると，どんな結果が得られるか．また，
３４，４５，５６
と入力するとどうなるか．

練習問題 9..1 上の例題でint n;をchar n;に変更するとどんな結果が得られるか．

iostream

には余白文字を無視しない関数がいくつかある．よく使われるのはcinのメンバ関数であるcin.get( )とcin.getline( )である．cin.get( )は文字配列から一文字ずつ読み，cin.getline( )は文字配列から一行ずつ読む．

例えば，上の例題で34，45，56を読み込みそのまま表示したい場合は，
char c;
while (cin.get(c))
{
cout.put(c);
}
とすればよい．

練習問題 9..2 34, 45, 56と入力し，
34,
45,
56
と表示するプログラムを作成せよ．

１文字以上の文字列を表す「文字列型」はオブジェクト扱いになる．標準のC++ 「string型」は $<$

string

のヘッダファイルで定義されている．「string型」のオブジェクトはいろいろな形で宣言されたり初期化される．

string s1;	// s1は零個の文字を含んでいる．
string s2 = "New York";	// s2は８個の文字を含んでいる．
string s3(60, '*');	// s3は６０個のアスタリスクを含んでいる．
string s4 = s3;	// s4は６０個のアスタリスクを含んでいる．
string s5(s2,4,2);	// s5は２文字"Yo"を含んでいる．

もし，文字列がs1のように初期化されなければ，１文字も含まないstringとなる．文字列は，s2のように文字配列と同じように初期化することができる．また，文字列は初期化後，s3のように指定された数だけ文字を格納することができる．文字配列との違いは，文字列ではs3のように別のオブジェクトのコピーを用いて初期化することができることである．s5(s2,4,2)は3つのパーツを持っている．親の文字列（s2,here），文字の開始(s2[4],here)，そして部分文字の長さ(2,here)である．

フォーマットされた入力は文字配列型と同じように文字列型でも使うことができる．
文字列型では文字を取り込むgetline()関数が文字配列型のcin.getline()と同じように使える．

const char* cs = s.c_str( ); // 文字列sを文字配列csに変換する．

c_str( )関数はconst char*型を持っている．

cout << s.length( ) << endl; // 文字列sの文字数７を表示する．

c_str( )関数はconst char*型を持っている．

string s6 = s + "HIJK"; // s6をEFを消去し"ABCD*FGHIJK"に変更

s2 += s5; // s2のHIをxyzで置き換え"New YorkYo"に変更

string s7 = "Mississippi River";

cout << s7.find("si") << endl; // 3を表示

cout << s7.find("so") << endl; // 文字列の長さ17を表示

例題 9..3 標準文字列型
次の文章
The first step is to study the status of the C++ Standard.を
The first stegep is tego stegudy the stegatus of the C++ Stegandard.
に書き換えるプログラムを作成せよ．ここでは，母音の前のtを見つけると，tの後にegを付けて出力している．

解答 tを見つけるには，find()関数を用いることができる．find()関数は見つかった文字が格納されている位置を返す．次に，tの後が母音かを判断しなくてはいけない．そこで，is_vowel()関数を作成する．is_vowel()関数は，母音かどうかを判断する関数なので，
bool is_vowel(char c) 　{
return (c =='a' $\vert\vert$ c== 'e' $\vert\vert$ c == 'i' $\vert\vert$ c == 'o' $\vert\vert$ c == 'u');
　}
と書けばよい．では，プログラムを作成しよう．

#include <iostream>
#include <string>
bool is_vowel(char);
using namespace std;
int main()
{
string word;
int k;
while(cin >> word) {
k = word.find("t");
if(k < word.length() && is_vowel(word[k+1])) {
word.replace(k+1,0,"eg");
}
cout << word << ' ';
}
}
bool is_vowel(char c)
{
return (c =='a' || c== 'e' || c == 'i' || c == 'o' || c == 'u');
}

$\begin{figure}% latex2html id marker 3025 \centering \includegraphics[width=15.15cm]{CPPPIC/reidai9-3.eps} \end{figure}$

C++におけるファイル処理は標準入出力とよく似ている．ファイルからの入力は，キーボードからの入力をistreamオブジェクト であるcinが管理するようにifstreamオブジェクト により管理されている．同様に，ファイルへの出力は，ディスプレイへの出力をostreamオブジェクト であるcoutが管理するように，ofstream により管理される．唯一の違いはifstreamとofstreamオブジェクトは明示的に宣言され，外部名を用いて初期化されなければならないことである．また，ヘッダファイル $<$

fstream

（またはANSIC++以前では $<$

fstream.h

）をインクルードしなければならない．

例題 9..4 ファイルの入出力
次の文をまずファイルinput.txtに保存する．このファイルを読み込んで，それぞれの語の先頭を大文字に変更し，ファイルoutput.txtに出力するプログラムを作成せよ．
Notice that the program has four objects: an ifstream object named infile, an ofstream object named outfile, a string object named wordm and a char object c.

解答それぞれの語の先頭を大文字に変更するプログラムを書けばよい．小文字を大文字に変更するには，小文字と大文字のASCIIコードでの差'A' - 'a'を変更したい文字に足せばよい．ファイルの読み込みと書き込みは

#include <fstream>
#include <iostream>
#include <string>
using namespace std;
int main()
{
ifstream infile("input.txt");
ofstream outfile("output.txt");
string word;
char c;
while(infile >> word){
if (word[0] <= 'a' && word[0] <= 'z') {
word[0] += 'A' - 'a';
}
outfile << word;
infile.get(c);
outfile.put(c);
}
}

練習問題 9..3 上の例題において，小文字から大文字への変換をword[0] += 'A' - 'a'で行なったが，toupper()関数を変わりに用いてプログラムを実行せよ．

コマンドラインからのリダイレクションを用いずに，外部ファイルを用いることの利点は，１つのプログラムに用いることのできるファイルの数に制限がないことである．

文字列ストリームは，ファイルを用いて文字列を扱う代わりに，メモリ内でテキストを扱うかのように文字列の使用を許すストリームオブジェクトであり，メモリ内I/Oともよばれる．したがって，文字列ストリームは入力と出力のバッファに非常に役に立つ．文字列ストリームの型istringstreamとostringstreamはヘッダファイル $<$

sstream

に定義されているので，これらを用いるときには， $<$

sstream

をインクルードする必要がある．

例題 9..5 文字列ストリーム
このプログラムは次の４つのオブジェクトを作る．文字列 s，整数 n，浮動小数点x，出力文字列ストリーム oss．出力がどうなるか調べよ．

#include <iostream>
#include <sstream>
#include <string>
using namespace std;
void print(ostringstream&);
int main()
{
string s="ABCDEFG";
int n=33;
double x=2.718;
ostringstream oss;
print(oss);
oss << s;
print(oss);
oss << " " << n;
print(oss);
oss << " " << x;
print(oss);
}
void print(ostringstream& oss)
{
cout << "oss.str() = \"" << oss.str() << "\"" << endl;
}

解答最初にprint(oss)が呼ばれたときには，ossにはまだ何も挿入されていない．次にprint(oss)が呼ばれたときには，ossには文字列"ABCDEFG"が読み込まれている．その次にprint(oss)が呼ばれたときには，空白とnの値33が読み込まれている．最後にprint(oss)が呼ばれたときには，ossにはさらに空白とxの値2.718も読み込まれている．

$\begin{figure}% latex2html id marker 3080 \centering \includegraphics[width=8.45cm]{CPPPIC/reidai9-5.eps} \end{figure}$

出力文字列ストリームオブジェクトossは出力ストリームcoutのような働きをする．つまり，文字列sの値，整数nの値，実数xの値は挿入演算子 $<<$

によって，ossに書き込まれる．言い換えると，内部オブジェクトであるossが外部テキストファイルのような働きをしている．このとき，内部オブジェクトossの中身はoss.str()によってアクセスできる．

例題 9..6 iss.str()
次の入力文字列ストリーム iss から文字列 s，整数 n，浮動小数点xを分けて取り出すプログラムを作成せよ．

解答入力文字列ストリームオブジェクトissは入力ストリームcinのような働きをする．つまり，文字列sの値，整数nの値，実数xの値が抽出演算子 $>>$

によって，issから読み込まれる．このとき，内部オブジェクトであるissは外部テキストファイルのような働きをしている．つまり，内部オブジェクトissの中身は読み込みによっては変化しない．

#include <ostream>
#include <sstream>
#include <string>
using namespace std;
void print(string&, int, float, istringstream&);
int main()
{
string s;
int n=0;
double x=0.0;
istringstream iss("ABCDEFG 44 3.14");
print(s,n,x,iss);
iss >> s;
print(s,n,x,iss);
iss >> n;
print(s,n,x,iss);
iss >> x;
print(s,n,x,iss);
}
void print(string& s, int n, float x, istringstream& iss)
{
cout << "s = \"" << s << "\", n = " << n << ", x = " << x
<< ", iss.str() = \"" << iss.str() << "\"" << endl;
}

$\begin{figure}% latex2html id marker 3099 \centering \includegraphics[width=14.05cm]{CPPPIC/reidai9-6.eps} \end{figure}$

練習問題 9..4 次のコードを以下の入力に対して実行すると，どんな結果が得られるか．
a. ABC 456 7.89 XYZ
b. ABC 4567 .89 XYZ
c. ABC 456 7.8 9XYZ
d. ABC456 7.8 9 XYZ
e. ABC456 7 .89 XYZ
f. ABC4 56 7.89XY Z
g. AB C456 7.89 XYZ
h. AB C 456 7.89XYZ

例題 9..7 ファイルの結合
次のプログラムは2つのファイルを結合して3つ目のファイルを作成する．データファイルnorth.datとsouth.datのデータは昇順にソートされている．プログラムは2つのデータファイルを読み，それらのデータをcombined.datファイルに昇順にコピーする．

#include <iostream>
#include <fstream>
using namespace std;
bool more(ifstream& fin, int& n)
{
if (fin >> n) return true;
else return false;
}
bool copy(ofstream& fout, ifstream& fin, int& n)
{
fout << " " << n;
return more(fin,n);
}
int main()
{
ifstream fin1("north.dat");
ifstream fin2("south.dat");
ofstream fout("combined.dat");
int n1,n2;
bool more1 = more(fin1, n1);
bool more2 = more(fin2, n2);
while(more1 && more2)
if(n1 < n2) more1 = copy(fout, fin1, n1);
else more2 = copy(fout, fin2, n2);
while(more1)
more1 = copy(fout, fin1, n1);
while(more2)
more2 = copy(fout, fin2, n2);
fout << endl;
}