テックデザインtop › フォーラム(掲示板)一覧 › テックデザイン講座 質問と回答集 › 官能評価 › 官能評価全般
-
投稿者投稿
-
T・Oキーマスター
p69について
段階尺度を偶数で設定することは良くないでしょうか?
特に、5段階よりも大きい6段階、8段階、、のように細かく設定されていると、中立付近も等間隔に近づき支障がないようにも思います。回答
段階尺度の尺度段階を偶数にする方法もあると思います.
特に評価段階の数が8とか10などのように多く,かつ,「かなり」とか「やや」などの強度用語を使用しない場合には,偶数にしても問題ないと思います.
例えば,両極尺度で10段階で評価する場合,第1段階の評価用語を「非常にやわらかい」とし,第2から第9段階の尺度には,強度用語をつけず,第10段階の評価用語に「非常にかたい」という用語をつける方法もあります.
段階尺度を奇数にするメリットは,「非常にかたい」「ややかたい」「どちらでもない」「やややわらかい」「非常にやわらかい」などのように,「どちらでもない」という用語を用いることができることです.場合によっては,「かたい」ともいえないし,「やわらかい」ともいえないという場合があると思います.特に段階数が5段階のように少ない場合には,そのような場合を考慮して,「どちらでもない」を入れます.また,「どちらでもない」を入れることによって,各用語間の主観的な距離を一定に保つ働きもあります.例えば,5段階評価にした場合には「非常に硬い」と「ややかたい」の主観的な距離が「ややかたい」と「どちらでもない」の主観的な距離とそれほど違わないのに,「どちらでもない」を省いて4段階評価した場合の「非常に硬い」と「ややかたい」の主観的な距離と「ややかたい」と「やややわらかい」の主観的な距離とでは,「ややかたい」と「やややわらかい」の主観的な距離の方が大きくなる可能性があります.「ややかたい」から「やややわらかい」の間には,「かたい」から「やわらかい」への評価の反転が含まれるからです.
段階尺度の場合,尺度の水準としては間隔尺度のデータだとみなして,平均値を求めることができるのですが,強度尺度のつけ方により,得られた尺度の等間隔生が損なわれた場合には,もはや間隔尺度とはいえず,平均値を求めることはできなくなります.
いずれにしましても「非常に」「かなり」「やや」などの強度用語を付与する場合には,それらを付与することによって,等間隔生が失われる可能性がないかどうか注意する必要があります.- このトピックはT・Oが2年、 10ヶ月前に変更しました。
T・Oキーマスター質問
尺度段階が多くない場合(たとえば5段階)の第2,3、4段階に強度用語を付けないことのデメリット(たとえば回答用紙にはめもりだけがかいてあり、第1が「非常にやわらかい」、第5が「非常にかたい」とだけ書かれているケース)は何でしょうか?
日本人の場合、中間の選択肢を選びたがる傾向にあると思いますので、奇数にして中央に段階を設けることを避けたい一方で、偶数ですと統計処理が難しくなるのでは?とのジレンマがあります。
5段階では「端っこ」「真ん中」を除くと第2,4段階のみの選択肢となり両極側それぞれ1メモリ分しかなく、中央によってしまいがちではと考え、6段階、7段階を考えていました。
一方段階数が多いとどこを選んだらよいかわからなくなる(おっしゃるところのランダム性)かと思います。
使用感としてクリームなどの「コクの有無」「のびの良さ」などで官能試験を行いますが、上記ジレンマを解消する方法はございますでしょうか回答
例えば5段階で,強度用語を第1と第5だけにつける方法で,一般的には問題ないと思います.
この場合には,第1を1点,第5を5点としてデータ処理をして,平均評価値を計算するということが行われています.
ただし,これは5段階評価でも10段階評価でもいえることですが,厳密に言うと,このように平均値を求めることが許されるのは,第1と第2,第2と第3などのように隣り合った尺度同士の主観的距離が等しい(つまり,得られた値が尺度水準で間隔尺度を満たしている)場合に限られるという制約があることを念頭においておく必要があります.
一般には,この等間隔性が満たされているものとして平均値の計算などが行われていますが,はたして本当にこの等間隔性は満たされているのだろうかという疑問を持つ人もいます.
等間隔性が満たされていない場合には,得られた値を間隔尺度のデータではなく,順序尺度のデータとして処理し,例えば,平均値ではなく中央値を求める方が正しいということになります.- この返信は2年、 10ヶ月前にT・Oが編集しました。
T・Oキーマスター<質問>
使用するパネルのレベルと人数については本などに記載があるが、その理由が知りたいです。
<回答>
分析型の場合,人数が多すぎて訓練が行き届かず,個人差が大きく出たり,判断基準が不統一になる可能性があります.また,少なすぎると1名の逸脱した評価が全体の評価結果を歪めてしまう可能性もあります.T・Oキーマスター<質問>
結果の妥当性をどのように判断したらよいのか知りたい。(肌感覚に合っていればよいのかなど)
<回答>
測定を何回か繰り返してデータの安定性を確認することと,訓練されたパネルのデータの分散の大きさも手がかりになるかもしれません.外的な基準があれば,それとの相関をとる方法もあります.T・Oキーマスター<質問>
多検体を比較する場合の検定方法の選択について(Excelで可能でしょうか、解析ソフトが必要でしょうか)
<回答>
試料の数が多い場合には,一対比較法は使えないと思います.非常に多い場合には,CATAがいいかもしれません.回答時間が節約できると思います.対応分析などの多変量解析をする場合は,解析ソフトかRを使うことになるかと思います.T・Oキーマスター<質問>
保存試験を行った場合の官能試験の留意点
<回答>
色味や味やテクスチャー,臭いなどの基準があれば,採点法で基準との差の限界値を決めておくとか,識別試験法などを取り入れたりする方法もあるかと思います.T・Oキーマスター<質問>
味覚に関して大変鋭い人を選別してはいますが、劣化試験等はその意見に左右されるといつまでもゴールが見えない事があり、苦労しています。特に経日的な劣化の試験に関しては、『許容』の線引きをどの程度でしていくのが良いのか、ご教示いただきたいです。
<回答>
パネルの訓練では,パネル間の評価の分散があまり大きくならないように,パネル同士で話しあって尺度合わせをします.皆さんで話しあって尺度合わせをする方向に調整したらいかがでしょうか.T・Oキーマスター<質問>
開発品やリニューアル品の改良ポイントを知りたい時の評価方法、項目の設定。例えば、食品について総合的に美味しくないと評価された場合、その原因は見た目、味、その他のどれが原因となっているのか回帰分析で改良ポイントを出したいが、その調査設計が難しいと感じる。
<回答>
総合評価で美味しくないと評価された場合は,関連すると思われる要因を一つずつ取り上げてそれらの要因について官能評価をし,関連しそうな要因を明らかにする以外にないような気がします.そこで関連しそうな要因が見つかったら,それらの要因を説明変数にして回帰分析したらいかがですか.T・Oキーマスターパネルの人数のことで 市原茂
パネルの人数を決定する際に、データの分散の大きさを考慮する必要があるというお話をしましたが、もう少し厳密に言いますと、パネルの人数は、実験の有意水準(α)、検定力(1-β)、効果量によって決まります。
実験の有意水準(α)というのは、仮説検定で帰無仮説(H0)が実際には真であるのに、間違えて対立仮説(H1)を採択してしまう誤り(これを第1種の誤りといいます)の確率のことをいいます。通常、αの値が5%以下であれば、第1種の誤りを犯す確率は低いと考えて帰無仮説を棄却して対立仮説を採択します。
例えば、AとBの平均値に差があるかどうかを検定したいときには、以下のように帰無仮説(H0)と対立仮説(H1)を立てます。
H0:AとBの平均値には差がない
H1:AとBの平均値には差がある
そして第1種の誤りを犯す確率(α)が5%以下であれば、帰無仮説(H0)を棄却して、対立仮説であるH1が採択されることになります。
一方、仮説検定で対立仮説(H1)が実際には真であるのに、間違えて帰無仮説(H0)を採択してしまう誤りもあります(実際には有意差があるのに、有意差なしとしてしまう誤り)。これを第2種の誤りといい、その確率はβになります。そして、検定力は1―βで定義され、1-βは、対立仮説が実際に真であるときに正しく対立仮説を採択する確率のことをいいます。一般的な検定力の基準は0.8とされ、検定力が0.8以下になると、第2種の誤りを犯す可能性が高くなることになります。
効果量は、実験変数の効果や変数間の関係の強さを表す指標で、データ数が多くなると有意になりやすくなる問題に対処する指標といえます。効果量は、検定の種類によって、様々な指標があります(水本・竹内、2008;豊田、2009)。
実験の有意水準(α)、検定力(1-β)、効果量に基づいてパネルの人数を決定する場合に、検定力分析ソフトG*Power(葛西、2011)をダウンロードして、必要なパネルの人数を割り出すこともできますし、豊田(2009)・永田(2003)を参考にすることもできます。
統計的検定というとαが5%以下かどうかということだけが問題にされることが多いように思いますが、検定力(Powerともいいます)や効果量も重要な情報だということです。
ただし、上記のG*Powerを使って必要なパネルの人数がわかったとしても、そこで示された必要数を集めるのが非常に大変な場合もあると思います。現状では、できる限りパネルを集めて、得られたデータについて、有意確率αを求めるだけでなく、検定力(1-β)や効果量も計算するという対処法もあると思います。<引用文献>
水本篤・竹内理 2008 Microsoft Word – EffectSize_KELES31.doc (mizumot.com)
葛西俊治 2011 検定力分析ソフトG*Powerについて 検定力分析 by 葛西俊治2011 (relak.net)
豊田秀樹(編著) 2009 検定力分析入門-Rで学ぶ最新データ解析- 東京図書
永田靖 2003 サンプルサイズの決め方 朝倉書店T・Oキーマスターある穀物を原料とした糖化液の官能評価を実施しようと考えております。
官能評価に使用するサンプル数は5種で、
全てのサンプルで同じ穀物原料を使用していますが、
それぞれ原料の加工方法や品種などに違いがございます。
そこで、原料の違いによる「甘みや苦みなどの味」「ざらつきやとろみなどのテクスチャー」「香り」の強さの違いを評価したいと考えております。
このような場合、官能評価の手法としてどの方法を用いるのが最適でしょうか。⇒テクスチャーや味や香りの強さを試料間で比較したいということでしたら、QDA法が一番良いと思います。
T・Oキーマスター市原茂先生による官能評価手法の紹介はこちら
https://www.jstage.jst.go.jp/article/jje/51/4/51_234/_pdf/-char/enT・OキーマスターT・Oキーマスター<質問>
3 評価対象間に評価はばらつきがあるかと存じます。平均値の差の検定を行った際、pが0.05以下(有意差あり)になることは少ないが、pが0.1(有意傾向)になることがあります。pが0.05以上0.1以下になる際、評価サンプル間に差がある、少し差がある、差があるとは言えないのいずれに該当するといえるでしょうか?<回答>
心理学の領域では、有意水準が5%以下であれば、統計的に有意差があったといい、10%の場合は、有意傾向があったという言い方をします。
5%という基準は慣例的なもので、6%では有意差がなくて意味がないのかということが以前から問題になっていますが、「有意傾向があった」という表現にしたらいかがでしょうか。 -
投稿者投稿