Filter
Exclude
Time range
-
Near
Built a Car Price Predictor with Python! 🚗 Cleaned messy data, engineered features with custom TargetEncoder. Tried Linear Regression (R² ~0.6), then nailed it with Random Forest (R² ~0.94). Try it: car-prediction-rf.streamlit.… #DataScience #MachineLearning #pythonprogramming
1
22
Most commonly used encoding techniques ⬇️ 1. OneHotEncoder 2. OrdinalEncoder 3. TargetEncoder When one-hot encoding gets too complex and ordinal encoding leads to inaccuracies, TargetEncoding often becomes the best choice. Learn more at the link below. #targetencoder #ML
2
10
231
Huh. TargetEncoder is actually a fairly recent addition to sklearn in 1.3.0. Dated to June 2023.
SklearnのTargetEncoderの使い方を教えて、とGeminiに聞いても「そんなものはありません」と返してくる URLを送っても「そのページにはScikit-learnにTargetEncoderが実装されていないことが明記されています」と頑なに否定してくる
19
Most commonly used encoding techniques ⬇️ 1. OneHotEncoder 2. OrdinalEncoder 3. TargetEncoder When one-hot encoding gets too complex and ordinal encoding leads to inaccuracies, TargetEncoding often becomes the best choice. Learn more at the link below. #targetencoder #ML
1
6
219
xfeatライブラリ、TargetEncoderがKFoldしか対応していないのかー
1
343
TargetEncoder()...hmmm That's a new one 🤔
86
Does any one have used targetEncoder? Need guidance #MachineLearning #sklearn
262
TargetEncoder の件は agg() メソッドと SciPy / NumPy の関数を組み合わせたときの動作がデグレしてる感じだったんだけど、果たして仕様なのか微妙なライン
1
286
Shirokumas v0.0.3 をリリースしました。py-polars 0.20.3 以降で TargetEncoder のスムージングに Empirical Bayesian を選ぶとエラーになっていた問題と、廃止予定のメソッド (map_dict / groupby) を使わないように変更しました pypi.org/project/shirokumas/
1
11
1,227
scikit-learn の TargetEncoder は BaseCrossValidator オブジェクトとか分割用のインデックス情報を渡せないんだなあ。ソースコードを読むと現状は KFold か StratifiedKFold の決め打ちになっている。それもタスク (分類・回帰) から自動的に決まる。
4
679
scikit-learn v1.3 で TargetEncoder が追加されてる!パラメータ見る限り、ちゃんと holdout TS になってるみたい。そして empirical bayes の smoothing も実装されてる scikit-learn.org/stable/modu…
20
107
10,490
For high-cardinality categories, use TargetEncoder (strong baseline in link.springer.com/article/10… ) or string-based methods (see ieeexplore.ieee.org/abstract… ) Neural-net embeddings require much more data 2/3

1
222
もう少しで Polars 版の Encoder 詰め合わせライブラリ公開できそうなところまで来た。パフォーマンスはなかなか有望で 10M 行の簡易ベンチマークによると学習と変換にかかる時間が: 自作 Polars 版 TargetEncoder: 2.91s category_encoders 版 TargetEncoder: 40.3s
1
6
57
6,087
Polars で実装した TargetEncoder を雑にベンチマークしたところ category_encoders 比でざっくり 7 倍くらい速くできてるみたいだ
17
1,030
TargetEncoder を実装した (2 種類の smoothing と out-of-fold 計算あり)
1
4
726
各ライブラリの TargetEncoder について、スムージングを「S」、Fold 毎の計算を「F」とすると category_encoders: S のみ nyaggle: S & F cuML: S & F xfeat: F のみ という状況みたいだ
5
962
xfeat の TargetEncoder はスムージングなさそうかな? github.com/pfnet-research/xf…

1
480
cuML の TargetEncoder のスムージングは論文 (7) 式を実装してるっぽいかな。ラプラススムージングの変形で m-probability estimate っていうらしい。事前確率は全カテゴリの平均にしている github.com/rapidsai/cuml/blo…

3
587