1.vector基本操作
https://c.biancheng.net/view/6749.html
2.set基本操作
https://c.biancheng.net/view/7196.html
//G文法结构体
struct G {
int Vt_number;
int Vn_number;
int P_number;
set<char> Vt;
set<char> Vn;
char S;
vector<string> P[255];
}G_instance;
1.first 函数的实现
*初始化标志位: 函数中有一个flag 标志位,用来检测 FIRST 集合在一轮迭代中是否有更新。
*迭代计算: 通过一个while 循环不断迭代,直到一轮迭代中 FIRST 集合没有任何变化(即flag 不再变为 1)。
*处理每个非终结符: 对于每个非终结符,函数遍历其所有产生式。
*如果产生式的第一个符号是终结符,则直接将其加入该非终结符的 FIRST 集合。
*如果第一个符号是非终结符,则需要合并这个非终结符的 FIRST 集合到当前非终结符的 FIRST 集合中。如果该非终结符的 FIRST 集合包含空串(表示为$),则还需考虑下一个符号。
*处理终结符: 每个终结符的 FIRST 集合就是其自身。
*更新检查: 在每次迭代的最后,调用check 函数来进一步更新 FIRST 集合。
2.辅助函数
first_string:计算一个字符串的 FIRST 集合。
check:对 FIRST 集合进行最终的检查和更新。
printG:打印文法的终结符、非终结符和产生式。
#include
#include
#include
#include
#include
#include
using namespace std;
//G文法结构体
struct G {
int Vt_number;
int Vn_number;
int P_number;
set<char> Vt;
set<char> Vn;
char S;
vector<string> P[255];
}G_instance;
//打印文法
void printG() {
cout << "Vt is:";
for (auto i = G_instance.Vt.begin(); i != G_instance.Vt.end(); i++) {
cout << *i << " ";
}
cout << endl;
cout << "Vn is:";
for (auto i = G_instance.Vn.begin(); i != G_instance.Vn.end(); i++) {
cout << *i << " ";
}
cout << endl;
for (auto i = G_instance.Vn.begin(); i != G_instance.Vn.end(); i++) {
if (!G_instance.P[*i].empty()) {
for (auto p = G_instance.P[*i].begin(); p != G_instance.P[*i].end(); p++) {
cout << *i << "->" << *p << endl;
}
}
}
}
//FIRST集
set<char> First[255];
set<char> first_string_set;
void first_string(string str) {
first_string_set.clear();
for (int i = 0; i < str.length(); i++) {
set<char> temp_first_sub_string;
set_union(temp_first_sub_string.begin(), temp_first_sub_string.end(), First[str[i]].begin(), First[str[i]].end(), inserter(temp_first_sub_string, temp_first_sub_string.begin()));
if (First[str[i]].find('$') != First[str[i]].end() && i != str.length() - 1) {
temp_first_sub_string.erase('$');
set_union(temp_first_sub_string.begin(), temp_first_sub_string.end(), first_string_set.begin(), first_string_set.end(), inserter(first_string_set, first_string_set.end()));
}
else {
set_union(temp_first_sub_string.begin(), temp_first_sub_string.end(), first_string_set.begin(), first_string_set.end(), inserter(first_string_set, first_string_set.end()));
break;
}
}
}
void check() {
for (auto vn = G_instance.Vn.begin(); vn != G_instance.Vn.end(); vn++) {
if (!G_instance.P[*vn].empty()) {
for (auto p = G_instance.P[*vn].begin(); p != G_instance.P[*vn].end(); p++) {
first_string(*p);
set_union(first_string_set.begin(), first_string_set.end(), First[*vn].begin(), First[*vn].end(), inserter(First[*vn], First[*vn].begin()));
}
}
}
}
void first() {
//flag为1表示first集有更新
// 0表示first集无更新
int flag = 1;
while (flag == 1) {
flag = 0;
for (auto i = G_instance.Vn.begin(); i != G_instance.Vn.end(); i++) {
//遍历非终结符号*i的产生式
//*p为当前的产生式
int len = First[*i].size();
if (!G_instance.P[*i].empty()) {
for (auto p = G_instance.P[*i].begin(); p != G_instance.P[*i].end(); p++) {
//首字符为终结符号
if (G_instance.Vt.find((*p)[0]) != G_instance.Vt.end()) {
First[*i].insert((*p)[0]);
}
else {
//首字符为非终结符号
for (int index = 0; index < (*p).length(); index++) {
//temp为FIRST(Y_k)
set<char> temp;
set_union(temp.begin(), temp.end(), First[(*p)[index]].begin(), First[(*p)[index]].end(), inserter(temp, temp.begin()));
if (temp.find('$') != temp.end() && index != (*p).length() - 1) {
temp.erase('$');
set_union(First[*i].begin(), First[*i].end(), temp.begin(), temp.end(), inserter(First[*i], First[*i].end()));
}
else {
set_union(First[*i].begin(), First[*i].end(), temp.begin(), temp.end(), inserter(First[*i], First[*i].end()));
break;
}
}
}
}
}
int new_len = First[*i].size();
if (new_len > len) {
flag = 1;
}
}
}
//终结符号的first集
for (auto i = G_instance.Vt.begin(); i != G_instance.Vt.end(); i++) {
First[*i].insert(*i);
}
check();
}
//打印first集
void print_first() {
for (auto i = G_instance.Vn.begin(); i != G_instance.Vn.end(); i++) {
cout << "first(" << *i << "):";
for (auto item = First[*i].begin(); item != First[*i].end(); item++) {
cout << *item << " ";
}
cout << endl;
}
}
//FOLLOW集
//#表示结束标志
set<char> Follow[255];
void follow() {
Follow[G_instance.S].insert('#');
//flag为1表示FOLLOW集有更新
// 0 无更新
int flag = 1;
while (flag == 1) {
flag = 0;
for (auto i = G_instance.Vn.begin(); i != G_instance.Vn.end(); i++) {
//遍历非终结符号*i
if (!G_instance.P[*i].empty()) {
for (auto p = G_instance.P[*i].begin(); p != G_instance.P[*i].end(); p++) {
//*p为当前非终结符号*i->产生式*p
for (int j = 0; j < (*p).length(); j++) {
char temp_vn = (*p)[j];
int len = Follow[temp_vn].size();
if (G_instance.Vn.find(temp_vn) != G_instance.Vn.end()) {
//当前字符为产生式中最后一个字符
if (j == (*p).length() - 1) {
set_union(Follow[temp_vn].begin(), Follow[temp_vn].end(), Follow[*i].begin(), Follow[*i].end(), inserter(Follow[temp_vn], Follow[temp_vn].end()));
}
else {
string temp_string = (*p).substr(j + 1, (*p).length() - j - 1);
//后继first集中包含空
first_string(temp_string);
if (first_string_set.find('$') != first_string_set.end()) {
first_string_set.erase('$');
set_union(first_string_set.begin(), first_string_set.end(), Follow[temp_vn].begin(), Follow[temp_vn].end(), inserter(Follow[temp_vn], Follow[temp_vn].end()));
set_union(Follow[temp_vn].begin(), Follow[temp_vn].end(), Follow[*i].begin(), Follow[*i].end(), inserter(Follow[temp_vn], Follow[temp_vn].end()));
}
else {
//后继first集不含空
set_union(first_string_set.begin(), first_string_set.end(), Follow[temp_vn].begin(), Follow[temp_vn].end(), inserter(Follow[temp_vn], Follow[temp_vn].end()));
}
}
}
if (len < Follow[temp_vn].size()) {
flag = 1;
}
}
}
}
}
}
}
void print_follow() {
for (auto i = G_instance.Vn.begin(); i != G_instance.Vn.end(); i++) {
cout << "follow(" << *i << "):";
for (auto item = Follow[*i].begin(); item != Follow[*i].end(); item++) {
cout << *item << " ";
}
cout << endl;
}
}
//SELECT集
string M[255][255];
void select() {
//初始化M
for (int i = 0; i < 255; i++) {
for (int j = 0; j < 255; j++) {
M[i][j] = "";
}
}
for (auto i = G_instance.Vn.begin(); i != G_instance.Vn.end(); i++) {
//遍历非终结符号*i
if (!G_instance.P[*i].empty()) {
for (auto p = G_instance.P[*i].begin(); p != G_instance.P[*i].end(); p++) {
//*p为当前非终结符号*i->产生式*p
set<char> select;
first_string(*p);
if (first_string_set.find('$') != first_string_set.end()) {
set_union(Follow[*i].begin(), Follow[*i].end(), select.begin(), select.end(), inserter(select, select.end()));
}
first_string_set.erase('$');
set_union(first_string_set.begin(), first_string_set.end(), select.begin(), select.end(), inserter(select, select.end()));
for (auto select_ = select.begin(); select_ != select.end(); select_++) {
M[*i][*select_] = *p;
}
cout << "SELECT(" << *i << "->" << *p << "):";
for (auto p_s = select.begin(); p_s != select.end(); p_s++) {
cout << *p_s << " ";
}
cout << endl;
}
}
}
}
void print_select(int sum) {
ofstream p;
string file_path = "output" + to_string(sum) + ".csv";
p.open(file_path, ios::out | ios::trunc);
p << "Vn" << ",";
set<char> input_set;
set_union(input_set.begin(), input_set.end(), G_instance.Vt.begin(), G_instance.Vt.end(), inserter(input_set, input_set.begin()));
input_set.erase('$');
input_set.insert('#');
for (auto vt = input_set.begin(); vt != input_set.end(); vt++) {
p << *vt << ",";
}
p << endl;
for (auto vn = G_instance.Vn.begin(); vn != G_instance.Vn.end(); vn++) {
p << *vn;
for (auto vt = input_set.begin(); vt != input_set.end(); vt++) {
if (M[*vn][*vt] != "") {
p << "," << *vn << "->" << M[*vn][*vt];
}
else {
p << "," << " ";
}
}
p << endl;
}
p.close();
}
void clear() {
G_instance.P_number = 0;
G_instance.Vn_number = 0;
G_instance.Vt_number = 0;
G_instance.S = ' ';
for (int i = 0; i < 255; i++) {
G_instance.P[i].clear();
Follow[i].clear();
First[i].clear();
}
G_instance.Vn.clear();
G_instance.Vt.clear();
first_string_set.clear();
for (int i = 0; i < 255; i++) {
for (int j = 0; j < 255; j++) {
M[i][j] = "";
}
}
}
int main() {
string file_path = "./FIRST-FOLLOW.txt";
ifstream file(file_path);
string arr[100];
int count = 0;
int sum = 0;
while (getline(file, arr[count]) && count < 100) {
if (arr[count].empty()) {
clear();
G_instance.P_number = count;
G_instance.S = arr[0][0];
for (int i = 0; i < count; i++) {
int len = arr[i].length();
string str = arr[i];
G_instance.Vn.insert(str[0]);
G_instance.P[str[0]].push_back(str.substr(2, len - 2));
for (int index = 0; index < len; index++) {
if ((str[index] >= 'a' && str[index] <= 'z') || str[index] == '$') {
G_instance.Vt.insert(str[index]);
}
}
}
G_instance.Vt_number = G_instance.Vt.size();
G_instance.Vn_number = G_instance.Vn.size();
printG();
cout << endl;
count = 0;
first();
print_first();
follow();
print_follow();
select();
sum++;
print_select(sum);
cout << endl;
}
else {
count++;
}
}
file.close();
return 0;
}