2024年度:問題分析ゼミ[20]

日時:2024年11月26日(火)15:20〜18:30
会場:リバティータワー1141教室
参加者:12名
欠席者:8名
遅刻者:2名
早退者:1名

①Pythonの講義
•Pythonにおけるエクセルデータの使用方法や、改行コード、文字コードの基本的な使用方法についての講義を聞いた。
テキストコードの使用 主にファイルを読み込む際にtxtを使用すると多くに対応できるが、csvも使うことができる。文字コードのミスマッチが起こることがよくあるため、どちらを使うか見極める必要がある。shift_jisか、euc_jなどの文字コードを試してみると良い。
読み込んだ分析の対象(表など)の見方と表の作成
グラフを作る際にどのようなもとデータが必要かを見極め不必要なデータは削除して良い。
どのような加工をデータに施せば、出力したいグラフや表を作成できるかよく考え実行すること。
エクセルの一部の情報のみを読み込ませる場合は、シートを指定するのが一番手っ取り早い。

Python用語の説明
A = [1,3,5,7]の場合、a[3] = 7のように表され数列として扱われる。
L = ['香山','森田','小林','大橋']というリストを指定した場合 L[2] = '小林'となる このようにリストを使えば、エクセルの表で列に名前をつけ、そのデータフレームにリストとして落とし込むことで、手作業の時間を大幅に短縮できる。
データフレームのカラム名を指定するだけで簡単に出力することができる。例:df.columms = clm_name 
新しいデータフレームを作成したのち、to_excel('') を使用して、エクセルに吐き出し、横に繋げたのちグラフを作る段階に入ると良い。
生成AIの使用も念頭に置く必要がある。行いたい事を明確にして最低限の用語を押さえておけば、カラムやリストの作成から、エクセルからの読み込みは概ねAIがプログラムを作成してくれるため、頼ることができる。

Google コラボとjupyter labについて
それぞれについて実行方法に違いがある。VScodeではグーグルコラボと違い最終的な出力にはPrint関数の仕様が必要で、どちらを使用するか選ぶ必要がある。

•Python実践
与えられたエクセルデータをもとに表を作成し、訪日外国人の推移をリサーチする
VSコードを使用して、pandasをインポートする→エクセルデータをpythonに読み込ませて、シートごとにデータを出力する→シートごとの欠損値を削除するコードを書く(ここまで進んだ)
リサーチ結果をもとに5年後の訪日外国人を3割増やす施策を考えレポートにまとめる

•反省
Pythonに使い慣れている人と慣れていない人に差が開いてしまうため、自分も含め基礎的なことからしっかり先生に質問して、上達して行かなければならない
生成AIを使うとすぐに終わるが、それでは地力がつかないため頼りすぎないよう気をつけたい。

作成:佐々木
編集:川西