EXCELにWEBページから貼り付けて利用しています。

Question

curd

10

10もっと見る

80pt

コンピュータインターネット

EXCELにWEBページから貼り付けて利用しています。

貼り付けを行うとHTML上の｢&nbsp｣まで張り付いており、
それをEXCELのVBA上で削除したいと思いいろいろ思考錯誤しておりますがうまくいきません。

ASC関数で調べると63を返すので、Replace関数でchr(63)を置き換えようとしますが、
一致しないらしく、まったく置換えができない状況です。
※同構文でたとえば｢a｣を削除などは問題なくできていますので、構文の問題ではないと考えています。
※なお、MID関数で一文字ずつ文字コード比較を行うと63でヒットしますのでわけがわかりません。。。

ネットでいろいろ検索しましたが、どれも解決にはいたっていないらしく途方にくれております。

EXCELのVBAに詳しい方がいれば解決方法をお教えください。

回答の条件

1人2回まで

登録：2008/02/28 17:04:22
終了：2008/03/06 17:05:02

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ardarim 2008/03/04 01:38:06

すみません。
寝ぼけてたんだかなんだか、見直したらいろいろ間違ってました。
もっともらしく書いたのに本当にすみません。

63は、'a'ではなく'?'ですね。
いずれにせよ、á（'a'の上にダッシュがついた文字）はシフトJISコードではあらわせないので、'?'に変換されます。日本語環境独自の問題であることは間違いありません。

なお、回答した方法よりスマートな方法が見つかりましたので追記しておきます。
文字列関数のUnicodeバージョン（ChrではなくChrW）を使うとうまくいきました。
たとえば、
Replace(Cells(1, 1).Value, ChrW(160), " ")
は期待通りの動作をします。

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

captim · Answer 1 · 2008-02-28T18:21:01+09:00

これでどうでしょうか？

Sub Macro1()

'

' &nbspを空白に変換する

'

Cells.Replace What:="&nbsp", Replacement:="", LookAt:=xlPart, _

SearchOrder:=xlByRows, MatchCase:=False, SearchFormat:=False, _

ReplaceFormat:=False

End Sub

りくっち · Answer 2 · 2008-02-29T11:28:01+09:00

いくつか確認を交えながら。

貼り付けを行うとHTML上の｢&nbsp｣まで張り付いており

具体的にどんなHTMLページをどんな方法でコピー貼り付けされていますか？

実のところ&nbspを削除できなくなるような状況が再現できなくて首を傾げています。

例えば、HTMLページを書式もそのままコピペしているということなら、&nbspを削除するとデータが変わってしまいます。

テキストだけが必要であれば、貼り付ける際に「形式を選択して貼り付け」でテキストを選択すれば&nbspは含まれませんし、

テーブルは直接外部データとしてインポートすることもできます。

ソースが必要であれば、ブラウザ側でソース表示してからコピペでき、この場合は簡単に置換できます。

こういうったことで状況が再現できないのです…。

そこで気になるのが

ASC関数で調べると63を返す

です。

VBのASC関数はその名の通りASCIIの10進文字コードを返すわけですが、

その場合、63は「?」を示します。

ASCII文字コード： IT用語辞典

アンパサンド（記号で書くとはてなは化けるの…）なら38、

&nbspの元々の意味である空白文字でも32（space）を算出しないとおかしいのです。

…ということは、貼り付けているHTMLソースがExcelに貼った時点で文字化けしているのではないか、という仮説がたつかと。

そのため文字コード自体が合わないので、検索も正しくできないのではないかと考えるわけです。

単純に「&nbsp」が含まれているテキストデータであれば、一般機能の置換処理をマクロ記録したものでも十分機能します。

以上から、まず一度貼り付けもとのHTMLソースを確認されることをご提案したいと思います。

以上ご参考まで。

ardarim · Answer 3 · 2008-02-29T22:48:29+09:00

Excelの不具合？だと思いますが、 の文字の扱いがおかしいです。

 は、Unicodeでは普通のスペース（U+0020）とは別の、U+00A0（10進数では160）が割り当てられています。（文字の名称としては、Non-break Space）

しかし、ExcelはHTMLからの変換の際に、ASCIIコードとして変換してしまっているようです。ASCIIコード（0x80～0xFFは拡張ASCII）では、0xA0は、「á」です。

ここでさらにおかしくしているのは、áが我々の使っているシフトJISのコードには存在しないため、Excelは、「á」に近い文字である「a」に勝手に変換して処理してしまいます。そのため、ASC()で文字コードを取得すると「a」の文字コード 0xA0（63）を返します。

一応回避策としては、ASCB()を使うと、63ではなく、160（0xA0）を取得できます。そのため、ASCB()で１文字ずつ操作して160の場合は と見なすことができそうです。Unicodeで切り出して（MID()）、ASCIIコードを取得する（ASCB()）という一見おかしな処理になるところがポイントです。

Excelが、0x100未満（0x00～0xFF）はASCIIと勝手に見なしてしまっておかしなことになっているのかもしれません。

EXCELにWEBページから貼り付けて利用しています。

回答（3件）

captim10962008/02/28 18:21:01

りくっち13661412008/02/29 11:28:01

ardarim8971452008/02/29 22:48:29

コメント（1件)

この質問への反応（ブックマークコメント）